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Essenti lie Gen und Genprodukte zur Identifizi rung, Entwicklung und 
Optimierung von immunologischen und pharmakologischen Wirkstoffen zur 
Behandlung mikrobieller Infektionen 

Beschreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Identifizierung und 
Charakterisierung essentieller Gene von pathogenen Mikroorganismen, deren 
Verwendung zum Auffinden neuerimmunologischer und pharmakologischer 
Wirkstoffe zur Prophylaxe, Therapie und Diagnose bakterieller Infektionen, 
sowie die Weiterentwicklung und Optimierung dieser Wirkstoffe. Von der 
Erfindung eingeschlossen sind die entsprechenden Nukleinsauren, welche 
fur die essentiellen Genprodukte kodieren, und die davon kodierten 
Polypeptide. AuSerdem betrifft die Erfindung Vektoren, die die 
erfindungsgemalSen Nukleinsauren enthalten, mit diesen Vektoren 
transformierte Zellen und fur die Polypeptide spezifische Antikorper. Diese 
Nukleinsauren und Polypeptide konnen zur Diagnose, Prevention und 
Behandlung von mikrobiellen Infektionen eingesetzt werden, insbesondere 
konnen sie zur Entwicklung von Antikorpern, Impfstoffen und Inhibitoren 
verwendet werden. 

Die vollstandige molekulare ErschliefSung des Genoms des Menschen und 
klinisch relevanter Pathogene offnet neue Wege in der Entwicklung von 
Therapeutika bzw. Prophylaktika gegen die Krankheiten des Menschen. So 
ist die Entschlusselung des menschlichen Genoms fur die nachsten Jahren 
angekiindigt. Die Anzahl molekular vollstandig charakterisierter pathogener 
Keime nimmt standig zu. Das erklarte Ziel ist es nun, aus dem 
umfangreichen Datenmaterial solche Gene zu identifizieren, deren Produkte 
als potentielles Ziel fur einen Wirkstoff in Frage kommen und somit fur die 
Entwicklung eines spezifischen Wirkstoff s benutzt werden konnen. Dieses 



Potential laBt sich aus der Primarstruktur eines Gens nicht ableiten, sondern 
muB experimentell bestimmt werden. 

Liegt die komplette genomische Sequenz eines Organismus vor, steht man 
vor dem Problem, die enorme Datenmenge fur weiterfuhrende biologische 
Analysen zuganglich zu machen. Der erste Schritt ist die Identifizierung 
aller auf dem Genom liegenden Gene. Dies geschieht in der Regel mit Hilfe 
computergestutzter Suchprogramme, die mit einer gewissen Sicherheit 
potentielle Gene vorhersagen konnen. Auf diese Weise konnen Genkarten 
erstellt werden, die allerdings noch mit einer grofcen Ungenauigkeit behaftet 
sind. Konnen die vom Suchprogramm ausgewiesenen Gene keinem 
bekannten Gen zugeordnet werden, mufc die Funktionalitat dieser 
hypothetischen Gene durch den physikalischen Nachweis der Genprodukte 
in der ursprunglichen Zelle nachgewiesen werden. 

Eine andere Strategie, die ebenfalls auf der Anwendung spezieller 
Suchprogramme beruht, ist auf die Identifizierung moglicher Genfamilien 
ausgerichtet, die mit speziellen biologischen Eigenschaften verknupft sind, 
die wiederum aufgrund weiterer Annahmen als Wirkstoffziel in Betracht 
kommen. Die Suchkriterien sind auf charakteristische Strukturmerkmale 
ausgerichtet, die in der Regel von schon bekannten Genen abgeleitet 
wurden. Das Ergebnis einer solchen Suche kann, in Abhangigkeit von der 
Annaherung der Vorgaben zum wirklichen Zustand, eine hohe Trefferquote 
liefern. In der Regel ist die Ungenauigkeit dieser Verfahren jedoch relativ 
hoch, und die wirkliche biologische Eigenschaft des Gens bzw. dessen 
Genprodukts mufc auf jeden Fall experimentell bestatigt werden. 

Eine weitere Strategie erfaSt die Expressionsprodukte einer Zelle, wodurch 
die zum jeweiligen Entwicklungszustand aktiven Gene identifiziert werden 
konnen. Vergleicht man verschiedene Entwicklungszustande miteinander, 
kann auf diese Weise das Zusammenwirken der Gene abgeleitet werden und 
in einigen Fallen kann die biologische Funktion unbekannter Gene teilweise 
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entschliisselt werden . Fuhrt man entsprechende Vergleichsuntersuchungen 
mit Zellen durch, die ein pathologisches Erscheinungsbild haben, ist es 
sogar moglich auch krankheitsverursachende Gene zu identifizieren und 
dieseals potentielle Wirkstoffzielefurdie Wirkstoffentwicklung einzusetzen. 

5 

Alle beschriebenen Verfahren dienen insbesondere dazu r bislang unbekannte 
Gene zu identifizieren und diesen mit Hilfe Computer-gestutzter 
Datenvergleiche eine biologische Funktion zuzuordnen. Eine eindeutige 
Bewertung eines Gens bzw. Genprodukts hinsichtlich seines Potentials als 
10 Wirkstoffziel zu dienen und somit fur die Entwicklung von Wirkstoffen 
herangezogen werden zu konnen, erfullt jedoch keines der bekannten 
Verfahren. 

Einige der wichtigsten Voraussetzungen fur einen pathogenen Organismus, 
15 in einem Wirt zu uberleben und sich zu vermehren, sind einerseits die 
Fahigkeit, dem Immunsystem des Wirts zu entgehen, und andererseits die 
Fahigkeit zur Anpassung an einen ganz speziellen Lebensraum oder Nische. 
Die dafur verantwortlichen Faktoren und Proteine sind somit in der Regel 
essentiell fur den pathogenen Keim. 

20 

Es ware von groSem Vorteil, diese essentiellen Gene von Mikroorganismen 
zu identifizieren, urn auf diese Weise die Moglichkeit zur Herstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln, z.B. 
Antikorpern, Impfstoffen oder Inhibitoren der entsprechenden Polypeptide 
25 zu bekommen. 

Ein Pathogen von besonderem medizinischen Interesse ist Helicobacter 
pylori. Dieser Keim ist ein Gram-negatives, spiralformiges Bakterium mit 
hohem pathogenen Potential, das in den letzten Jahren verstarkt 
30 Resistenzen gegen eine Reihe therapeutisch relevanter Antibiotika 
entwickelt hat und somit von gro&er klinischer Bedeutung ist. Es zeichnet 
sich durch extrem hohe Beweglichkeit aufgrund seiner Flagellen und der 
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ungewohnlichen Fahigkeit, im stark sauren Milieu (bis pH 1,5) des Magens 
uberleben zu konnen, aus (Goodwin et al., 1989). 

Obgleich das Auftreten von spiralformigen Bakterien in der menschlichen 
Magenschleimhaut seit langem bekannt ist, weifc man erst seit der 
erfolgreichen Isolierung und Kultivierung dieses Bakteriums (Warren and 
Marshall 1983; Marshall et al., 1984) aus der Magenschleimhaut eines 
Patienten mit einem Magengeschwur (Ulcus ventriculi), daS es sich hierbei 
urn pathogene Keime handelt. Die Mp//or/-lnfektion zahlt zu den haufigsten 
chronischen bakteriellen Infektionen des Menschen. Sie tritt weltweit auf, 
wobei ca. 50% der Bevolkerung mit diesem Bakterium infiziert sind. 

Eine Infektion fuhrt zwangslaufig zur Auslosung einer bakteriellen Gastritis 
(Typ-B Gastritis) beim Menschen. Ferner geht man davon aus, daS H. pylori 
auch eine ursachliche Rolle bei der Entstehung von Magen- und 
Zwolffingerdarmgeschwuren (Ulcus ventriculi und Ulcus duodeni) sowie bei 
einigen Formen des Magenkarzinoms (Adenokarzinom) spielt (Lee et al., 
1 993; Solnick und Tompkins, 1 993). In zwei Studien von 1 991 wurde eine 
statistisch signifikante Korrelation zwischen der Mpy/o/v-lnfektion und dem 
Auftreten des Magenkarzinoms (intestinaler Typ) gezeigt, wobei beide 
Studien zu dem SchluS kamen, daS ca. 60% aller auftretenden 
Magenkarzinome wahrscheinlich auf eine Mp//or/-lnfektion zuruckzufuhren 
sind (Parsonnet et al., 1991; Nomura et al., 1991). Auch die seltener 
auftretenden MALT (Mucosa Associated Lymphoid Tissue) Lymphome des 
Magens, die als Vorstufen von B-Zell-Tumoren des Immunsystems 
angesehen werden, sind vermutlich eine Folge der Mpy/o/Y-lnfektion. Eine 
Folge der Langzeitinfektion mit H. pylori ist die atrophische Gastritis, eine 
Degeneration der Schleim, Saure oder Pepsin produzierenden Zellen des 
Magenepithels, die als eine prakanzerose Lasion angesehen werden muB. 

Nach der oralen Aufnahme gelangen die Bakterien zunachst in das extrem 
saure Magenlumen (pH 1 bis 2). Dort wird durch die Produktion des Enzyms 



Urease, das zur Spaltung des vorhandenen Harnstoff s und damit zur lokalen 
Neutralisierung des sauren pH-Wertes im Magen fiihrt, .was das Uberleben 
der Bakterien ermoglicht. Mittels chemotaktischer Orientierung und 
flagellenabhangiger Motilitat bewegen sich die Keime dann in die 
Bicarbonat-gepufferteSchleimschichtder Antrum-RegiondesMagens, ihren 
eigentlichen naturlichen Habitat. Dort befinden sie sich in einer einzigartigen 
okologischen Nische, die aufgrund der Saurebarriere nur fur wenige 
konkurrierende Bakterienarten zuganglich ist, Vermutlich orientieren sich die 
Bakterien an den pH-Gradienten zwischen Lumen (pH 1-2) und 
Epithelzelloberflache (pH 6-7), um zum Epithel zu gelangen. Durch ihre 
spiralige Form, ihre Beweglichkeit im viskosen Schleim, die Produktion von 
Mukus-modifizierenden Enzymen und schliefclich durch eine mikroaerophile 
Lebensweise sind diese Keime optimal an die Lebensbedingungen in diesem 
Habitat angepalSt. Sie halten sich meist in den tiefen Krypten der Antrum- 
Region auf, wo sie vor aulSeren Einflussen wie z.B. Saure, Pepsin aber auch 
vor Medikamenten zu ihrer Eradikation, wie z.B. Antibiotika, geschutzt sind. 
Ein Teil der Bakterienpopulation (ca. 20%) ist eng mit Epithelzellen 
assoziiert, vor allem mit Schleim produzierenden Zellen. Unter der 
Voraussetzung einer gastralen Metaplasie, d.h. der saureinduzierten 
Ausbildung von gastralem Epithel im Duodenum, kommt es auch zur 
Kolonisierung metaplastischer Areale im Zwolffingerdarm, wodurch die 
Voraussetzungen zur Entstehung des Zwolffingerdarmgeschwurs (Ulcus 
duodeni) geschaffen sind. Durch ihre Fahigkeit zur Adharenz wird vermutlich 
eine komplette Ausscheidung der Helicobacter mit dem abgestoRenen 
Schleim verhindert, so da& die Bakterien fur Jahre, Jahrzehnte oder gar 
lebenslang persistieren konnen (chronische Infektion). 

Bevor die Existenz und die Bedeutung des H. pylori fur die 
Ulkuserkrankungen bekannt waren, wurden diese durch sog. Antazida, oder 
H 2 -Rezeptorantagonisten behandelt. Dabei handelt es sich um Substanzen, 
welche die Sauresekretion der Magenparietalzelle inhibieren. Unter dem 
EinfluS dieser Arzneimittel kommt es zwar zumeist zur Abheilung von 
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Geschwuren, da jedoch eine der Ursachen dieser Geschwure, namlich die 
A/.py/or/'-lnfektion, damit nicht eliminiert wird, kommt es in den meisten 
Fallen nach kurzer Zeit zu einem erneuten Auftreten der Ulzeration (Rezidiv) . 

Eine weitere, haufig bei Ulzerationen angewandte Therapie ist die Wismut- 
Behandlung. Verschiedene Wismut-Salze (CBS, BSS) haben einen 
bakteriziden Effekt auf H. pylori. Ein bedeutender Nachteil dieser 
Therapieform ist jedoch, dafc eine totale Eradikation des Keims nur in einem 
sehr geringen Prozentsatz der Falle erreicht wird (8 bis 32%). Wie bei der 
Behandlung mit Antazida kommt es nur zu einer vorubergehenden 
Suppression des Keims, und nach Absetzen der Behandlung erfolgt in den 
meisten Fallen wieder ein Aufflackern der Infektion. Ein weiterer Nachteil 
der Wismut-Behandlung ist, daB eine langer dauerende Therapie mit hohen 
Dosen zu einer Akkumulation dieser Substanz in der Leber, Niere und dem 
Nervensystem fuhrt und betrachtliche neurologische Nebenwirkungen hat 
(Malfertheiner, 1994). 

Seit der Erkenntnis, daS es sich bei den gastroduodenalen 
Ulkuserkrankungen urn Infektionskrankheiten handelt, werden zur 
Behandlung nun auch Antibiotika eingesetzt. Die Monotherapie mit 
verschiedenen Antibiotika (Amoxicillin, Nitrofuran, Furazolidin, Erythromycin 
und dergleichen) stellte sich jedoch als nicht zufriedenstellend heraus, da es 
auch hier nur bei 0 bis 15 % der Zellen zur kompletten Eradikation der 
Keime kommt. Die bisher erfolgreichste Behandlung wird zur Zeit durch eine 
Kombination eines Saureblockers (Ompeprazol) mit einem Antibiotikum 
(Amoxicillin) erreicht, die zu Eradikationsraten bis zu 80% fuhren kann 
(Malfertheiner, 1994). Auf die Dauer ist eine Antibiotikabehandlung zur 
Eliminierung von H.py fori jedoch nicht erfolgversprechend, da aufgrund der 
unvollstandigen Eradikation des Keims mit einer raschen Resistenz- 
entwicklung der Bakterien gegen Antibiotika gerechnet werden muS. 
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Das zunehmende Auftreten von Antibiotika-Resistenzen und die 
eingeschrankten Behandlungsoptionen, die in der Regel betrachtliche 
unerwunschte Nebenwirkungen haben, macht das Auffinden neuer 
Therapieformen und dabei insbesondere die Identifizierung neuer Wirkstoffe 
5 notwendig, vor allem Impfstoffe, die sowohl zur prophylaktischen, als auch 
therapeutischen Behandlung von A/e//co/?acfer-lnfektionen verwendet 
werden konnen. Von besonderem Interesse ist auch die Darreichungsform, 
da der Wirkstoff im Magen # d. h. in einem extrem sauren Milieu wirksam 
sein muS. Verbindungen mit Protonenblockern, die z. B. vor der 
10 Verabreichung des prophylaktischen oder therapeutischen Wirkstoffs 
gegeben werden, konnen hierbei von groBem Nutzen sein. 

Die molekulare Grundlage fur persistierende, chronische Helicobacter- 
Infektionen ist bislang noch nicht geklart. Es konnte gezeigt werden, date 

15 die Faktoren Urease, Beweglichkeit und Adharenz essentielle Eigenschaften 
des Bakteriums sind, die gastrische Mukosa kolonisieren zu konnen. 
Obgleich der Wirtsorganismus unter normalen Bedingungen nicht in der Lage 
ist, mit einer Mpy/o/v-lnfektion fertig zu werden, zeigte sich im Tiermodell, 
date die Urease, ein essentieller Virulenzfaktor von H. pylori, ein hohes 

20 Potential, als Vakzin besitzt (US-Patentanmeldung US-SN-07/970,006 
"Urease-based Vaccine Against Helicobacter Infection). 

Diejenigen Komponenten jedoch, die dafiir verantwortlich sind, daB das 
Pathogen das Immunsystem des Wirtes umgehen kann, sind bisher noch 
25 unbekannt. 

Pathogene Organismen im Allgemeinen haben eine Vielzahl von Strategien 
entwickelt, im Wirt uber einen langen Zeitraum vom Immunsystem 
unbehelligt persistieren zu konnen (Haas und Gobel, 1992; Finlay und 
30 Falkow, 1 997). Ein Mechanismus, der zum Uberleben in lebensfeindlichem 
Milieu dient, ist die Ausbildung einer Uberdauerungsform. 
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Im Falle von H. pylori sind in der Literatur kokkoide Formen als potentielle 
Uberdauerungsformen mehrfach beschrieben, ihre klinische Bedeutung ist 
allerdings umstritten. Kokkoide Formen konnten fur eine ex vivo 
Uberdauerung eine grofce Rolle spielen. Hinsichtlich der in vivo 
5 Uberdauerung wurde gezeigt, dafc kokkoide Formen bevorzugt durch ein 
ungunstiges Milieu wie z. B. einen hohen 0 2 -Partialdruck Oder subletale 
Gaben von Antibiotika (Wismut-Subcitrat, Erythromycin, Amoxicillin, 
Metronidazol) induziert werden (Donelli et al., 1998; Bode et aL, 1993; 
Sorberg et aL, 1996; Berry et a/., 1995). 

10 

Einige Forscher gehen davon aus, daS diese kokkoiden Bakterien 
lebensfahig, aber nicht kultivierbar sind (VNC f viable but non-culturable). 
Eaton und Mitarbeiter erhielten eine erfolgreiche Infektion von Mini- 
Schweinchen mit vegetativen (spiraligen) H. pylori, wahrend kokkoide 

15 Formen in diesem Modell keine Infektion zeigten (Eaton et aL, 1995). Der 
direkte Nachweis von kokkoiden Formen im menschlichen Magen wurde von 
Chan et al. anhand von Magengewebeschnitten aus Biopsiematerial 
erbracht. In 82.8 % (53/64)der untersuchten Biopsieproben konnten die 
Autoren kokkoide Formen von H. pylori nachweisen (Chan et al, 1994). 

20 Von Cao et al. wurde ein monoklonaler Antikorper zum spezifischen 
Nachweis von kokkoiden H. pylori im Gewebeschnitt benutzt. Auch hier 
wurden neben den vegetativen Formen in 100 % der Antrumbiopsien (9/9) 
H. pylori kokkoide Formen nachgewiesen (Cao et aL, 1997). 

25 Die Bindung an Epithelzellen und die Fahigkeit zur Signaltransduktion (IL-8- 
Induktion, Rearrangement des Zytoskeletts, Bindung von Plasminogen, 
Laktoferrin und Vitronectin auf der Bakterienoberflache) scheint bei 
kokkoiden Formen vergleichbar zu den vegetativen Formen erhalten zu sein 
(Khin etaL, 1996; Segal et aL, 1996). 

30 

Die oben genannten Experimente deuten auf eine Bedeutung kokkoider 
Formen fur die Uberlebensfahigkeit von Helicobacter \r\ ungunstigem Milieu 



hin. Daher ist die Identifizierung von Genen, die mit der Entstehung dieser 
Form und Reaktivierung in die vitale Form zusammenhangen, fur die 
Entwicklung neuer Wirkstoffe von grdlStem Interesse. 

Neben Helicobacter pylori konnen auch andere Helicobacter Spezies den 
Magen des Menschen kolonisieren wie z. B, H. heilmannii und H. felis. 
Diesbezuglich konnte gezeigt werden, daS auch H. heilmannii mit 
krankhaften Ulkuserkrankungen in Zusammenhang gebracht werden kann. 
Die ursachliche Ubertragung findet wahrscheinlich von Haustieren auf den 
Menschen statt. Bislang wurde der im Menschen haufig vorkommende 
H. pylori in den Verdacht gebracht, bei der Entstehung von Magenkrebs eine 
Rolle zu spielen. Mittlerweile gibt es klinische Daten, die diesen 
Zusammenhang anzweifeln. Besonders werden diese Zweifel durch neuere 
Daten von Helicobacter heilmannii unterstutzt, die diesem ein groBeres 
kanzerogenes Potential beimessen und dessen Bedeutung bei der 
Entstehung des gastrischen MALT Lymphoms hervorherben (Regimbeau et 
al., 1988). 

Wird das bisher Gesagte zusammenfassend betrachtet, ist es klar, da& ein 
Bedurfnis nach neuen Therapieformen fur die Bekampfung bakterieller 
Krankheitserreger, insbesondere nach Impfstoffen und Inhibitoren von 
essentiellen Genen bzw. deren Expressionsprodukten besteht. Die 
zunehmende Resistenzentwickung gegen eine Vielzahl bewahrter 
Medikamente erfordert eine kontinuierliche Versorgung mit neuen 
Wirkstoffen. Dieser steigende Bedarf an neuen Wirkstoffen kann nur 
gedeckt werden, wenn neue Wirkstoffziele identifiziert und diese zur 
Entwicklung neuer Wirkstoffe herangezogen werden. Essentielle Gene 
stellen fur die Wirkstoffentwicklung ein ideales Ziel dar, da sie fur das 
Uberleben des Krankheitserregers notwendig sind. 

Die identifizierung essentieller Gene von Helicobacter, insbesondere von 
H. pylori bzw. heilmannii und von moglichen Helicobacter 
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Uberdauerungsformen zur Entwicklung unci Optimierung neuer 
therapeutischer, praventiver und/oder diagnostischer Mittel, wie z. B. 
Impfstoffe und pharmakologischer Wirkstoffe stellt daher ein Ziel der 
Erfindung dar. Im Vordergrund steht das Auffinden essentieller mikrobieller 
Gene, wobei auch homologe Proteine verschiedener pathogener Keime 
identifiziert werden konnen. Mit Hilfe eines Wirkstoffs konnten dann wie bei 
den klassischen Antibiotika mehrere pathogene Keime gleichzeitig eliminiert 
werden. Bei Helicobacter stehen insbesondere Gene im Vordergrund, die 
lebensnotwendige Funktionen im Infektionsprozefcerfullen, sowie Gene, die 
an der Entwicklung und Reaktivierung von kokkoiden Formen beteiligt sind. 
Von besonderem Interesse sind hierbei essentielle Gene, die fur sekretierte 
Genprodukte kodieren, da diese fur immunologische und pharmakologische 
Wirkstoffe aufgrund ihrer exponierten Lokalisation besonders gut erreicht 
werden konnen und daher gute Kandidaten zur Wirkstoff entwicklung sind. 
Weiterhin von Interesse sind essentielle Gene, die fur Genprodukte kodieren, 
die an der Entwicklung und der Aufrechterhaltung von 
Uberdauerungsformen beteiligt sind. Eine weitere Aufgabe ist das Auffinden 
essentieller mikrobieller Gene, wobei auch homologe Proteine verschiedener 
pathogener Keime identifiziert werden konnen. Mit Hilfe eines Wirkstoffs 
konnten dann wie bei den klassischen Antibiotika mehrere pathogene Keime 
gleichzeitig eliminiert werden. 

Diese Aufgabe wird_geI6st durch ein Verfahren zur Bereitstellung von 
Mitteln zum Nachweis, zur Therapie oder/und zur Prevention von 
mikrobiellen Infektionen, das die folgenden Schritte umfaSt: 
(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendefizienter Mikroorganismen durch 
konditionale Antisense-Hemmung (CAI) oder/und subtraktive 
Rekombinations-Mutagenese (SRM) und Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen in einem 
Testsystem. 
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(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung der 
Mikroorganismen oder verwendeter Mikroorganismen herbeifiihren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit als 
Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Das hier dargestellte Verfahren befafit sich mit der Identifizierung 
essentieller Gene und deren Verwendung zur Entwicklung neuer Wirkstoffe. 

Ein weiterer Aspekt der vorliegenden Erfindung ist somit auch ein Verfahren 
zum Identifizieren von essentiellen mikrobiellen Genen, das die folgenden 
Schritte umfaBt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i) # 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer mikrobiellen 
DNA-Sequenz, in der die gendefizienten Mikroorganismen defiziert 
sind und 

(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur die 
Uberlebensfahigkeit sind. 

CAI ist die Abkurzung fur ^conditional antisense inhibition", d.h. 
konditionale Antisensehemmung. Es handelt sich hierbei um ein Verfahren, 
welches weiter unten naher beschrieben ist. 

SRM steht fur „subtractive recombination mutagenesis", d.h. subtraktive 
Rekombinationsmutagenese und ist ebenfalls unten beschrieben. 
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Der Ausdruck "gendefizient", wieer hier verwendet wird, bedeutet, date der 
defiziente Organismus nicht in der Lage ist, ein Oder mehrere seiner 
Genprodukte herzustellen oder deren Funktion zu nutzen. Die Herstellung 
des entsprechenden Genprodukts kann einerseits durch Mutagenese des 
entsprechenden Gens verhindert werden, oder es kann eine Inhibition 
wahrend der Expression stattfinden, z.B. durch Antisensenukleinsauren. 
Eine Mutagenese kann dazu eingesetzt werden, ein Gen in dem Genom des 
Mikroorganismus zu mutieren, oder dazu, ein mutiertes Gen in den 
Mikroorganismus einzubrigen, wobei man sich auch die homologe 
Rekombination zunutze machen kann. 

Ein proteinkodierender Abschnitt einer Nukleinsauresequenz ist beispielweise 
ein Gen oder ein Teil eines Gens das/der die Expression eines Polypeptids 
erlaubt. 

Der Begriff "essentielles Gen" bedeutet ein Gen, das fur ein Genprodukt 
kodiert, ohne welches ein Organismus nicht uberlebensfahig ist oder nur 
beschrankt uberlebensfahig ist. Essentielle Gene konnen in zwei Klassen 
unterteilt werden: obligat essentielle und fakultativ essentielle Gene. Ein 
obligat essentielles Gen kodiert fur ein Protein, das fur das Uberleben oder 
die Vermehrung eines Organismus unter alien Umstanden unabdingbar ist. 
Demgegenuber kodiert ein fakultativ essentielles Gen fur ein Protein, das 
lediglich unter bestimmten Bedingungen fur das Uberleben oder die 
Vermehrung des Organismus notwendig ist, wie z.B. die Fahigkeit des 
Organismus, innerhalb von kultivierten Saugerzellen oder im Tier zu 
uberleben. In beiden Fallen wird das Uberleben oder die Vermehrung des 
Organismus durch die Inaktivierung eines fur ihn essentiellen Gens bzw. die 
Inhibierung eines fur ihn essentiellen Genproduktes stark beeintrachtigt bzw. 
verhindert. Ist ein Bakterium nach der Inaktivierung eines bestimmten Gens 
nicht mehr uberlebensfahig bzw. in der Vermehrung eingeschrankt, kann 
dies als erster Hinweis dafur gewertet werden, dafc durch dieses Gen 
essentielle Eigenschaften vermittelt werden. Die Aussagekraft solcher 
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Befunde muB jedoch durch begleitende Kontrollexperimente untermauert 
werden, z.B. sollte eine solche letale Mutation in einem zweiten Schritt 
durch eine entsprechende Komplementation des Gens bzw. Genprodukts 
aufgehoben werden konnen. Obligat essentielle Gene sind demnach solche, 
deren Nichtexpression oder Nichtvorhandensein, z.B. durch Mutagenese 
oder Deletion dazu fuhrt, date der Organismus weder in naturlicher 
Umgebung, noch auf einem ideal auf die Bedurfnisse des Mikroorganismus 
abgestimmten Vollmedium lebensfahig ist. 1st ein Mikroorganismus in einem 
fakultativ essentiellen Gen defizient, ist er in der Regel auf einem solchen 
je nach Organismus definierten Vollmedium noch wachstumsfahig, kann 
jedoch in naturlicher Umgebung, d.h. in seinem naturlichen Wirt oder Zellen 
oder Gewebekulturen seines naturlichen Wirtes nicht mehr uberleben. 

Identifizieren von essentiellen Genen 

Durch das neue Verfahren konnen unabhangig von ihrer speziellen Funktion 
essentielle Gene von Mikroorganismen identifiziert werden. Bevorzugt wird 
dieses Verfahren zur Identif izierung von essentiellen Genen aus Helicobacter 
und verwandten Mikroorganismen eingesetzt. 

In einem ersten Teilschritt wird das komplette Genom eines bakteriellen 
Krankheitserregers mit einem molekulargenetischen Ansatz nach essentiellen 
Genen durchsucht. Dieser Teilschritt erfordert keinerlei Kenntnisse uber die 
Primarstruktur des Genoms bzw. individueller Gene, sondern erfolgt 
ausschlielSlich aufgrund biologischer Kriterien. Ist ein Gen als essentielle 
Determinante identifiziert, wird dessen Identitat ermittelt. Hierbei kann auf 
die ermittelten Rohsequenzdaten der genomischen Sequenzierungen 
zuruckgegriffen werden. Anhand der ermittelten Gensequenz konnen z. B. 
isogene Varianten ermittelt werden bzw. ob sich das ermittelte Gen in einem 
Operon befindet, in dem sich moglicherweise weitere essentielle Gene 
befinden. 
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In einem zweiten Teilschritt werden die identifizierten Gene in spezielle 
genetische Systeme uberfuhrt, die dazu dienen die Gene bzw. deren 
Genprodukte einem direkten Wirkstoff-Screening zuzufuhren und/oder die 
Gene bzw. Genprodukte dazu verwendet, bereits identifizierte Wirkstoffe 
weiter zu optimieren. Der wesentliche Vorteil des Gesamtverfahrens beruht 
auf der rasch aufeinanderfolgenden Ausfuhrung des Gen- und Wirkstoff- 
Screenings in aussagekraftigen biologischen Systemen, so date in relativ 
kurzer Zeit aus dem kompletten Gensatz eines pathogenen Mikroorganismus 
die potentiellen Wirkstoffziele identifiziert, produziert und diese direkt zum 
Wirkstoff-Screening bzw. Optimierung eingesetzt werden konnen. 

Falls ein Mirkoorganismus untersucht wird, dessen Genom bereits 
sequenziert ist, kann die Identifizierung eines Gens oder Genabschnitts mit 
Hilfe von Datenbankanalysen erfolgen, wobei einem Sequenzabschnitt ein 
Leserahmen zugeordnet wird. Bevorzugt kann jedoch unabhangig vom 
Vorhandensein einer vollstandigen Genomerzeugung eine beliebige Genbank 
einer Vorselektion unterzogen werden. Dabei kann bevorzugt die 
Vorselektion auf Gene durchgefuhrt werden, die fur Polypeptide mit einer 
bestimmten Funktion kodieren, zum Beispiel mit Hilfe von 
Homologieanalysen. Die Vorselektion kann auch auf Gene durchgefuhrt 
werden, die nur in bestimmten Entwicklungsstufen exprimiert werden. 

Im Rahmen des ersten Teilschritts kann durch Selektionsschritte eine starke 
Reduktion des zu untersuchenden Genmaterials erzielt werden. Z.B. durch 
einen Anreicherungsschritt fur Gene, die fur exportierte oder sekretierte 
Genprodukte kodieren. In diesem speziellen Verfahren werden die DNA- 
Abschnitte einer Genbank von einem Pathogen mutagenisiert, was 
beispielsweise durch Klonieren eines solchen DNA-Abschnitts in ein 
Plasmid, Transformation in einen bevorzugt heterologen Wirtsorganismus 
und anschlie&ende Mutagenese erfolgen kann. Das daraus entstandene 
Expressionsprodukt kann dann nachgewiesen werden. Die Mutagenese kann 
beispielsweise durch Insertion einer Markersequenz erfolgen, welche bei 
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Expression der mutagenisierten Sequenz in einem Wirtsorganismus zu einem 
Fusionspolypeptid fuhrt, auf das selektiert werden kann. Die Insertion der 
Markersequenz ist nicht auf Transposoninsertion beschrankt, sondern kann 
auch auf andere Art und Weise erfolgen, beispielsweise durch homologe 
Rekombination oder Infektion und Rekombination mit Hilfe von 
Bakteriophagen. 

Die verwendete Markersequenz im Sinne der vorliegenden Erfindung ist im 
allgemeinen ein Gen, das fur ein Genprodukt kodiert, das eine Selektion auf 
diejenigen Wirtsorganismen erlaubt, welche diese Sequenz exprimieren. Im 
allgemeinen handelt es sich bei diesen Markersequenzen um Resistenzgene, 
die Resistenz gegen bestimmte Antibiotika verleihen, oder welche es dem 
Wirtsorganismus erlauben, in einem Selektionsmedium zu uberleben. Der 
Genmarker besitzt bevorzugt keine eigenen Expressionssignale, sondern ist 
direkt abhangig von einem vorgeschalteten Promoter, wie z.B. dem 
Transkriptionspromotor auf dem Promotersegment oder ein Promoter, der 
auf dem klonierten heterologen zu identifizierenden DNA-Fragment liegt. 
Alternativ zu Antibiotikaresistenz-Markersequenzen konnen auch Enzyme als 
Genmarker eingesetzt werden. In diesen Fallen wird die erfolgreiche 
Insertion durch eine bestimmte Farbreaktion angezeigt, welche die manuelle 
Isolierung des entsprechenden Bakterienklons erlaubt. 

Wenn die Markersequenz als Fusionsprotein mit dem Expressionsprodukt 
des inserierten DNA-Fragments exprimiert wird und eine Selektion wie oben 
beschrieben durchgefuhrt wird, kann DNA-Material aus den selektierten 
Bakterienklonen isoliert werden und die DNA-Sequenz, die fur das 
Fusionsprodukt kodiert, nach bekannten Verfahren bestimmt werden. Dies 
erlaubt die Zuweisung eines Leserahmens zu dem zu identifizierenden DNA- 
Fragment. Es ist dann moglich, Vergleichsstudien mit allgemein verfugbaren 
DNA-Sequenzdatenbanken durchzufuhren, um die Identitat des 
identifizierten Gens abzuklaren und gegebenenfalls Hinweise auf eine 
biologische Funktion zu erlangen. 
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Durch technische und weitere Erganzungen der beiden unten dargestellten 
Verfahren, CAI und SRM, kann eine zielgerichtete Reduktion des 
Probenvolumens erreicht werden. Dabei handelt es sich ebenfalls um 
vorgeschaltete Selektionsverfahren, die auf bestimmte Gengruppen abzielen, 
z.B. der Einsatz subtraktiver Genbanken von pathogenen und apathogener 
Vertretern. Hierbei werden pathogenitatsvermittelnde Genbereiche 
angereichert. Derartige Subtraktionsverfahren konnen auch angewendet 
werden, um fur bestimmte Organismen spezifische Gene zu identifizieren, 
beispielsweise durch einen Vergleich und Subtraktion der Genomen von 
H. pylori und H.heilmannii. 

In weiteren Verfahren konnen z.B. Gengruppen identifiziert werden, die nur 
in einem bestimmten Entwicklungsschritt exprimiert werden. 
Hervorzuheben ist beispielsweise das Array-Verfahren, bei dem die 
einzelnen Genproben des Pathogens rasterfdrmig auf einen Trager 
aufgebracht werden. Die einzelnen Auftragspunkte sind bekannt, so date 
bei einer positiven Hybridisierungsreaktion mit den entwicklungsspezifischen 
Transkriptionsprodukten oder cDNAs Oder subtraktiven cDNAs oder 
Fragmente davon, die jeweiligen Gene identifiziert und anschlieSend kloniert 
werden konnen. Andere Verfahren, die entwicklungsspezifische Gengruppen 
erfassen, sind vergleichende Proteom- und Differential-Display-Analysen. 

Um herauszufinden, ob es sich bei den identifizierten Gensequenzen um 
essentielle Gene handelt, werden Mikroorganismen hergestellt, welche in 
den Sequenzen defizient sind, welche den identifizierten Gensequenzen 
entsprechen. Die defizienten Mikroorganismen werden dann auf 
verschiedenen Wachstumsmedien bzw. Zellkulturen oder im Tiermodell oder 
im naturlichen Wirt getestet, und die defizienten Gene konnen dann je nach 
Wachstumsfahigkeit einer Kategorie der nicht essentiellen, obligat 
essentiellen oder fakultativ essentiellen Gene zugeordnet werden. 
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Auf die Bedeutung von Genen, welche die Entwicklung aus der vitalen in die 
Uberdauerungsform und umgekehrt steuern, ist bereits eingangs 
hingewiesen worden. Es ist daher besonders bevorzugt, eine Vorselektion 
auf solche Gene durchzufuhren. Im Weiteren konnen Verfahren wie etwa 
CAI oder SRM angewendet werden und die gendefizienten Mikroorganismen 
dann auf bestimmten Nahrmedien untersucht werden, welche den Ubergang 
von der einen in die andere Form auslosen. Bei Helicobacter ist insbesondere 
das Schivo-Medium bevorzugt, welches die Reaktivierung der kokkoiden 
Form in die vitale spiralige Form ermoglicht. 

Die Erzeugung von defizienten Mikroorganismen kann auf mehrere Arten 
erfolgen. 

Es stehen eine Reihe von molekulargenetischen Verfahren zur Verfugung, 
das Genom eines bakteriellen Pathogens so zu mutagenisieren, date von 
jedem Gen eine Mutante zur Verfugung steht. Die gangigste 
Mutagenesemethode beruht auf der Inaktivierung von Genen, z. B. durch 
zufallig im Genom inserierendeTransposons, die uber entsprechende Marker 
selektioniert werden. Fur dieses Verfahren bestehen zahlreiche Variationen, 
die auf verschiedene Organismen angewendet werden konnen. (Joyce und 
Grindley, 1984; Akerley, et aL, 1998). Mit Hilfe der inserierten 
Transposons laSt sich auch das mutagenisierte Gen im Genom genau 
lokalisieren. 

Hat man eine Genmutante mit einem nachweisbaren biologischen Effekt 
erzeugt, z.B. ein vermindertes Wachstum der Zellen in einem bestimmten 
Milieu, so muB in einem zweiten Schritt die eindeutige Kopplung des Gens 
bzw. des Genprodukts mit dieser Eigenschaft nachgewiesen werden. Dies 
geschieht in der Regel durch Komplementationsexperimente. In diesem Fall 
wird in den Organismus mit der spezifischen Genmutante das ursprungliche 
Gen eingebracht und exprimiert. Kann uber diesen Weg die ursprungliche 
Eigenschaft des Organismus regeneriert werden, ist der notwendige Beweis 
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erbracht. Allerdings lafct sich dieses Verfahren nicht bei der 
Charakterisierung von Letalmutanten ahwenden, d.h. bei Mutanten obligat 
essentieller Gene. Einen Ausweg bietet die Verwendung konditionaler 
Mutationen zur Komplementation. Z. B. lassen sich durch chemische 
Mutagenese des untersuchten Gens temperatursensitive Mutanten 
erzeugen, die das Genprodukt bei der normalerweise optimalen 
Wachstumstemperatur in eine inaktive Zustandsform bringen und bei 
niedrigeren Temperaturen ein biologisch aktives Genprodukt hervorbringen 
(Das, et al., 1976; Harris, et aL, 1992; Hou, eta/, 1994; Polissi and 
Georgopoulos, 1996). In einem anderen praktizierten Ansatz werden die 
wildtypischen Komplementationen durch exogene Substanzen, sogen. 
Induktoren, gesteuert. Uber diese Induktoren wird die Expression des 
komplementierenden Gens eingeschaltet, das auf einem Episom in die 
genspezifische Mutante eingebracht wird und nach Induktion das fehlende 
Genprodukt ersetzt (Murphy, et a/., 1995-. Chow and Berg, 1 988; Arigoni, 
etaL, 1998). 

Die genannten Verfahren sind sehr zeitaufwendig und werden nur fur die 
Untersuchung individueller Gene oder begrenzter genomischer Abschnitte 
eingesetzt. Verfahren, die eine durchgangige Charakterisierung einer 
vollstandigen, mutagenisierten Genbank eines ausgewahlten Pathogens 
nach dem beschriebenen Schema ermoglichen, sind bislang nicht bekannt. 

Die nachfolgend beschriebenen neuen genetischen Verfahren, die 
Konditionale Antisense-Hemmung (CAI) und die Subtraktive 
Rekombinationsmutagenese (SRM) erfullen diese Anforderungen. Beide 
Verfahren konnen zur Identifizierung essentieller Gene eingesetzt werden, 
wobei sich das CAI-Verfahren besonders fur die Identifizierung obligat 
essentieller Gene eignet und das SRM-Verfahren fur fakultativ essentielle 
Gene. 
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Das CAI-Verfahren beruht auf der konditionalen Hemmung der Translation 
von einem oder mehreren Genen, die auf einem klonierten Genomfragment 
(welches dann als Matrize oder Template dient) liegen und uber ein Plasmid 
im zu untersuchenden Keim propagiert werden. Im Vergleich zu 
konventionellen Verfahren bleibt die genomische Struktur des zu 
untersuchenden Keims unverandert, d.h. im Originalzustand. Im zu 
untersuchenden Keim wird die Hemmung der Translation durch die 
konditional induzierbare Synthese spezifischer Antisense-RNA (asRNA) 
ausgeldst, die das komplette klonierte Genomfragment umfafct, inklusive der 
auf dem Genomfragment lokalisierten Gene. Die Antisense- 
Nukleinsauresequenzen konnen dann im Mikroorganismus in groSen Mengen 
synthetisiert werden und binden an die urspriingliche mRNA, wobei diese 
mRNA nicht mehr translatiert werden kann und somit dem 
Expressionsapparat entzogen wird. Die Folge ist, da& entweder kein 
Genprodukt oder nur geringe Mengen davon gebildet werden. Die Synthese 
der asRNA unterliegt der Kontrolle durch einen Promoter (asPromoter), 
dessen Aktivitat konditional, durch definierte, externe Signale gesteuert 
wird. Diese konditionale Inhibition der Expression eines Gens oder Operons 
erfolgt somit uber die Regulation der Synthese der asRNA durch den 
induzierbaren asPromoter. Zum Nachweis, daB ein Gen bzw. Operon, wie 
im vorliegenden Fall, fur das Uberleben und die Vermehrung des Organismus 
unter bestimmten Bedingungen essentiell ist, wird die Uberlebens- und 
Vermehrungsrate eines Klons, in dem die Synthese der asRNA induziert ist, 
mit seiner Uberlebens-/Vermehrungsrate bei nicht induzierter asRNA 
Synthese verglichen. Ist die Uberlebens-/Vermehrungsrate des Klons bei 
Induktion der asRNA Synthese vermindert, so handelt es sich bei dem 
inhibierten Gen bzw. Operon um ein (obligat oder fakultativ) essentielles 
Gen. Diese Wachstumsanalysen konnen automatisiertdurchgefuhrt werden, 
so daS eine sehr groSe Anzahl von Genen innerhalb kurzer Zeit untersucht 
werden konnen. Aus diesen Klonen wird das Plasmid isoliert und die DNA- 
Sequenz des klonierten Genomfragments, das als Template fur die asRNA 
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Synthese dient, bestimmt und in Folge die Struktur des essentiellen Gens 
ermittelt. 

Ein fur das CAI-Verfahren geeigneter Plasmidvektor ist in Abbildung 1 
dargestellt. Er enthalt ein genomisches oder subgenomisches DNA-Fragment 
aus dem zu untersuchenden Mikroorganismus unter der Kontrolle eines 
induzierbaren Promoters {P) und weiteren ublichen Expressionssignalen 
sowie ein mRNA-stabilisierendes Element, so date das DNA-Fragment in 
Form von Antisense RNA (asRNA) exprimiert werden kann und eine lange 
biologische Aktivitat hat. Ein geeigneter Promoter ist z.B. der Tet-Promoter. 
In einer besonders bevorzugten Ausfiihrungsform kodiert der CAI-Vektor 
zusatzlich ein Gen fur ein regulatorisches Protein, welches den Promoter 
reguliert, in diesem Fall, z.B. den Tet-Repressor, welcher durch ein exogenes 
oder extrazellulares Signal, wie z.B. Tetrazyklin, gesteuert werden kann. Der 
CAI-Vektor der besonderen Ausfuhrungsform von Abbildung 1 enthalt 
weiterhin ein oder mehrere selektionierbare Markergene sowie zwei 
Replikationsursprunge (ori), einen fur den zu untersuchenden 
Mikroorganismus (hier als Pathogen bezeichnet) und einen weiteren fur 
einen ublichen Klonierwirt z.B. E.coli. Mit Hilfesolcher CAI-Vektoren konnen 
aus ganzen mikrobiellen Genomen Antisense-Bibliotheken erstellt werden. 

Abbildung 2 zeigt eine schematische Darstellung eines bevorzugten CAI- 
Verfahrens. Von einem CAI-Plasmid, das kleine Fragmente einer 
genomischen Bank des zu untersuchenden Mikrooganismus enthalt, wird 
asRNA von einem induzierbaren Promoter (Pj) aus, unter Kontrolle eines 
extrazellularen Signals synthetisiert (siehe Abb. 1). Die asRNA hybridisiert 
sequenzspezifisch mit der mRNA desjenigen Gens, das dem klonierten DNA 
Fragment auf dem CAI Plasmid entspricht. Durch die Bildung des asRNA- 
mRNA Hybrids wird die Translation dieser mRNA reduziert oder verhindert. 
In Folge entsteht ein defizienter Mikroorganismus, der nicht in der Lage ist, 
date betreffende Genprodukt zu bilden. Handelt es sich um das Produkt 
eines essentiellen Gens, dessen Bildung inhibiert wird (A), ist die 
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Lebensfahigkeit des entsprechenden Klons eingeschrankt oder verhindert. 
Die Lebensfahigkeit des Mikroorganismus wird im folgenden anhand seiner 
Lebens- oder Uberlebens- oder Vermehrungsrate in einem definierten 
biologischen System bestimmt. Bei nicht erfolgender Induktion der asRNA 
Synthese (B), oder wenn das CAI-Plasmid das Fragment eines nicht- 
essentiellen Gens enthalt (C), ist der Klon des Mikroorganismus normal 
lebens- und vermehrungsfahig. 

In besonders bevorzugten Ausfuhrungsformen des CAI-Verfahrens werden 
ganze Antisense-RNA-Plasmidbanken aus genomischen Fragmenten des zu 
untersuchenden Mikroorganismus analysiert (siehe Abbildung 3). Eine 
genomische Bank mit CAI-Plasmiden (siehe Abb. 1) wird in den zu 
untersuchenden homologen Mikroorganismus unter nicht-induzierenden 
Bedingungen ubertragen und die plasmidtragenden Klone uber einen 
plasmidkodierten Marker selektioniert. Die Lebensfahigkeit der einzelnen 
Klone, die jeweils ein bestimmtes CAI Plasmid aus der Genbank erhalten, 
wird anschlie&end anhand ihrer Vermehrungsrate unter induzierten bzw. 
nicht induzierten Bedingungen ( + und - in der Abbildung), bezogen auf die 
asRNA Synthese, im direkten Vergleich untersucht. In Klonen, die sich unter 
asRNA induzierenden Bedingungen kaum oder nur langsam vermehren, wird 
die Translation von mindestens einem essentiellen Gen verhindert. Aus 
diesen Klonen werden die CAI-Plasmide isoliert. Die essentiellen Gene 
werden durch Sequenzierung der genomischen Fragmente in den isolierten 
CAI-Plasmiden identifiziert. 

Dieser Ansatz laBt sich auch bevorzugt mit einem subtraktiven Verfahren 
kombinieren (SCAI), von dem eine Ausfuhrungsform zur Veranschaulichung 
in Abb. 4 dargestellt ist. Eine genomische Bank mit CAI-Plasmiden (siehe 
Abb. 1 und 3) wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen und die entstehenden individuellen Klone werden als bakterielle 
CAI-Bank in einem Pool zusammengefafct. Dieser Pool wird zur Selektion in 
zwei identische Gruppen (den Driver- und den Tester-Pool) aufgespalten. 
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Der Ausdruck "Driver" wird hierbei fur denjenigen Pool von bakteriellen 
Klonen verwendet, der so behandelt wird, da& der induzierbare Promoter 
aktiviert wird und asRNA vom CAI-Vektor exprimiert. Der "Tester"-Pool 
enthalt einen identischen Satz Klone mit CAI-Plasmiden, der jedoch unter 
nicht-induzierenden Bedingungen gehalten wird und somit Wildtyp- 
Eigenschaften besitzt. 

In der Regel wird der "Driver"-Pool zur Selektion (z.B. im Tier) eingesetzt, 
wahrend der "Tester"-Pool unbehandelt aufbewahrt wird. Es konnen aber 
auch beide Gruppen einer Selektion unterzugen werden, wobei lediglich der 
"Driver"-Pool durch Gabe des Signals (z.B. Tetrazyklin) induziert wird. 
Klone, in denen durch die Expression einer bestimmten asRNA die 
Translation eines essentiellen Gens gehemmt wird, gehen wahrend der 
Selektion aus der Gruppe verloren. Nach angemessener Zeit werden die 
iiberlebenden Klone beider Gruppen wiedergewonnen und die CAI-Plasmide 
aus den Klonen beider Gruppen isoliert. Die klonierten genomischen 
Fragmente werden anschlie&end uber PCR amplifiziert, wobei Oligonukleotid 
Primer verwendet werden, die mit Vektorsequenzen seitlich der klonierten 
genomischen Fragmente hybridisieren. Diejenigen amplifizierten DNA 
Fragmente, die Teile von essentiellen Genen darstellten, werden durch 
subtraktive Hybridisierung (siehe Abb. 8) angereichert und isoliert. 

Ein erfindungsgemaS fur einen CAI-Vektor geeigneter Promoter ist 
beispielsweise der Tet-Promoter, dessen Aktivitat uber ein regulatorischen 
Proten (in diesem Fall den Tet-Repressor) gesteuert werden kann und durch 
ein extrazellulares Signal (Tetracyclin) induziert werden kann. Weitere 
induzierbare Promoteren sind im Stand der Technik bekannt. 

Antisense-RNA stabilisierende Elemente sind dem Fachmann auf diesem 
Gebiet bekannt und brauchen hier nicht naher erlautert zu werden. 
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Der hohe Wirkungsgrad des CAI Verfahrens bei der Inaktivierung von 
Einzelgenen in einem Organismus ergibt sich aus der uberlappenden 
Klonierung kleiner genomischer Fragmente und der damit einhergehenden 
Synthese unterschiedlicher asRNA Abkommlinge fur einen bestimmten 
Genbereich. Auf diese Art wird die Wahrscheinlichkeit, eine asRNA zu 
erhalten, welche die Translation des gesuchten Zielgens effizient inhibiert, 
stark erhdht. Derartige Untersuchungen konnen auf das komplette Genom 
eines Pathogens ausgerichtet werden, was die Uberprufung einer sehr 
grolSen Anzahl individueller genomischer Fragmente erforderlich macht. Hier 
sind apparative Hilfsmittel (Roboter) von Vorteil, um einen hohen 
Probendurchsatz zu erzielen. Allerdings konnen in diesen Fallen nur 
bestimmte Zustande untersucht werden, z. B. das Wachstum der Zellen in 
einem bestimmten Medium. 

Durch den zusatzlichen EinsatzsubstraktiverVerfahrensschritte(Subtractive 
Conditional Antisense Inhibition, SCAI), kann die Anzahl der zu 
untersuchenden individuellen Klone bevorzugt stark reduziert werden. 

Die Subtraktive Rekombinationsmutagenese (SRM) wird bevorzugt zur 
Identifizierung fakultativ essentieller Gene herangezogen. Im Unterschied 
zum CAI-Verfahren werden dauerhafte Genmutationen erzeugt, wobei die 
Anreicherung essentieller Gene Qber einen substraktiven Schritt erreicht 
wird. Die SRM Methpde kann wie das CAI Verfahren mit Genbanken von 
pathogenen Mikroorganismen durchgefuhrt werden. 

Das SRM Verfahren beruht auf der Inaktivierung einzelner Gene im Genom 
eines Pathogens durch vollstandige Insertion eines bestimmten 
Suizidplasmids, wobei dieses ein Teil einer Genbank ist. Die Insertion der 
Plasmide in das Genom erfolgt, durch homologe Rekombination. Die 
erfolgreiche Insertion wird durch Expression eines plasmidkodierten 
Antibiotikum-Resistenzmarkers angezeigt. 
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Eine bevorzugte Ausfuhrungsform der SRM-Methode wird anhand der 
Abbildungen 5 bis 8 veranschaulicht. 

In Abbildung 5 ist ein geeigneter SRM-Vektor dargestellt, der wie der CAI- 
Vektor ein genomisches oder subgenomisches DNA-Fragment des zu 
untersuchenden Mikroorganismus enthalt, so wie einen Replikationsursprung 
(ori) fur einen Klonierwirt (z.B. E.coli), ein oder mehrere selektionierbare 
Markergene und einen weiteren konditional aktiven Replikationsursprung fur 
den zu untersuchenden Mikroorganismus, z.B. einen temperatursensitiven 
Ursprung oder einen Ursprung, dessen Aktivitat von einem in trans 
vorhandenen Replikationsfaktor abhangig ist und der zusatzlich in das 
System eingebracht werden kann. Dadurch date das SRM-Plasmid eine 
genomische Sequenz des zu untersuchenden Mikroorganismus enthalt, 
kommt es bei Transfektion dieses Vektors in diesem Mikroorganismus zu 
einer homologen Rekombination, bei der das gesamte SRM-Plasmid in das 
genomische Gen des Mikroorganismus inseriert wird und das entsprechende 
Gen, fall es sich um ein solches handelt, inaktiviert. Dies fuhrt zu einer 
Insertionsmutante. Geeignete induzierbare Replikationsursprunge sind, wie 
erwahnt, temperatursensitive oris oder solche, die durch einen Faktor 
gesteuer werden konnen, wie z.B. den RGK-Faktor pir oder den pWV Faktor 
repA, der in trans dem System zugefuhrt wird. 

Die Insertion eines SRM-Plasmids (siehe Abb. 5) in das Genom des zu 
untersuchenden Mikroorganismus erfolgt uber homologe Rekombination 
zwischen dem im Plasmid klonierten genomischen Fragment des 
Mikrooganismus und der komplementaren, genomischen DNA Sequenz. 
Nachdem das Plasmid in den entsprechenden Mikroorganismus uberfuhrt 
worden ist, werden unter nicht permissiven Bedingungen, d.h. bei inaktivem 
ori, diejenigen Klone uber Selektion auf den plasmidkodierten Marker isoliert, 
in welchen das SRM-Plasmid in das Genom inseriert ist. Die Exzision des 
SRM-Plasmids erfolgt ebenfalls uber homologe Rekombination. Unter 
permissiven Bedingungen wird die Replikation des insertierten Plasmids 
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eingeleitet, wodurch genugende Mengen an freiem Plasmid in den Zellen 
entstehen, so date das Plasmid aus dem Klon wleder isoliert werden kann. 
Sofern die Insertion eines SRM-Plasmids in ein essentielles Gen 
stattgefunden hat, wird die Lebensfahigkeit des betreffenden Klons 
eingeschrankt (A), wahrend Mutanten in nicht-essentiellen Genen normal 
lebensfahig sind (B). 

Ebenso wie beim CAI-Verfahren kann eine Bank von Insertionsplasmiden 
aus genomischen Fragmenten des zu untersuchenden Mikroorganismus in 
diesen Mikroorganismus ubertragen werden und genomische 
Insertionsmutanten gebildet werden. Diese bevorzugte Ausfuhrungsform des 
SRM-Verfahrens ist in Abbildung 7 dargestellt. Eine Bank von SRM- 
Plasmiden, die einzelne genomische oder subgenomische Fragmente 
enthalten, wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen. Unter Bedingungen, welche die Plasmidreplikation nicht 
erlauben, werden genomische Insertionsmutanten mit Hilfe eines 
plasmidkodierten Markers (siehe Abb. 5) selektioniert. In diesem Schritt 
konnen nur Insertionsmutanten uberleben, die in einem nicht- oder fakultativ 
essentiellen Gen mutiert sind, da Mutanten eines essentiellen Gens nicht 
lebensfahig sind. Die individuellen Insertionsmutanten werden in einem Pool 
zusammengefaSt und dieser Pool anschlieSend in zwei identische Gruppen, 
den Driver- und den Tester-Pool, aufgeteilt. Der Driver-Pool wird 
selektioniert, z.B. durch die Infektion eines Tiers. Der Tester-Pool bleibt 
unbehandelt. Durch die Selektion gehen solche Klone aus dem Driver-Pool 
verloren, die eine Insertion in einem fakultativ essentiellen Gen (das fur das 
Uberleben und die Vermehrung unter den Selektionsbedingungen notwendig 
ist) enthalten. Anschliefcend werden aus den uberlebenden Klonen beider 
Pools, die in das Genom des Mikroorganismus inserierten Plasmide unter 
permissiven Bedingungen rezirkularisiert und zuriickgewonnen. In dem 
Driver-Pool fehlen solchen Plasmide, die Fragmente von fakultativ 
essentiellen Genen enthalten. Die in den SRM Plasmiden klonierten 
Fragmente werden in beiden Pools anschlieSend uber PCR amplifiziert (siehe 
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Abb. 4). Diejenigen amplifizierten DNA Fragmente, die Teile von fakultativ 
essentiellen Genen darstellen, werden durch genetische Subtrakion (siehe 
Abb. 8) angereichert und isoliert. 

Eine besondere Ausfuhrungsform, welche sich eine subtraktive 
Hybridisierung zur Anreicherung in Fragmenten essentieler Gene zunutze 
macht, ist in Abbildung 8 beispielhaft veranschaulicht. 

A: PCR-basierte genetische Subtraktion. Die Tester DNA-Fragmente 
(siehe Abb. 4 und 7) werden mit einem Adapteroligonukleotid in 
solcher Weise ligiert, daS der Adapter nur mit einem der beiden DNA 
Strange eines doppelstrangigen Tester DNA Fragments kovaJent 
verbunden ist, was z.B. durch die Ligation eines doppelstrangigen, 
nicht phosphorylierten Adapters an die 3'-phosphoryIierten DNA 
Fragmente der Tester DNA erreicht wird. Diese Tester DNA 
Fragmente werden dann mit einem molaren Uberschuss an Driver 
DNA Fragmenten gemischt. Die Mischung wird denaturiert und 
langsam rehybridisiert. Anschliefcend werden uberhangende 
Einzelstrangenden mit DNA Polymerase zum Doppelstrang aufgefullt. 
Die Produkte dieser Reaktion werden mittels PCR amplifiziert, wobei 
Oligonukleotid Primer verwendet werden, die den Adaptersequenzen 
entsprechen. Nur solche Tester DNA Fragmente, die nicht mit Driver 
DNA Fragmenten hybridisert haben, werden exponentiell amplifiziert 
somit angereichert und anschliefcend durch Klonierung isoliert. 

B: Genetische Subtraktion durch physikalische Abtrennung von 
biotinylierten DNA Fragmenten. Die Driver DNA Fragmente werden 
biotinyliert und anschlieBend im UberschuB mit Tester DNA 
Fragmenten gemischt, denaturiert und langsam rehybridisiert. Die 
biotinylierten Homo- Driver-Driver Doppelstrange und Heteroduplexe 
(Driver-Tester Doppelstrange) werden durch Extraktion mit Trager- 
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gekoppeltem Streptavidin von den Tester-Tester Homoduplexen 
abgetrennt. Letztere werden durch Klonierung isoliert. 

Die beispielsweise durch SRM erzeugten Insertionsmutanten werden in 
Tierversuchen Oder Zellkultursystemen hinsichtlich ihrer veranderten 
biologischen Eigenschaften untersucht. Durch die gezielte Verwendung 
spezieller Wirtszellen, z.B. kultivierte Makrophagen oder Wirtsgewebe, z. B. 
MHz, konnen Gengruppen selektiert werden, die essentielle Eigenschaften 
des Pathogens determinieren, z.B. die Besiedlung bestimmter Wirtszellen. 
Isoliert man die uberlebenden Mutanten aus den Zellen, so fehlen die 
Mutanten essentieller Gene. Subtrahiert man aus der kompletten Genbank, 
die uberlebenden Mutanten, so erhalt man die Mutanten der essentiellen 
Gene. Dies geschieht uber einen speziellen PCR-basierten 
Substraktionsschritt. 

Das CAI- bzw. das SRM-Verfahren ist eine sehr effiziente Methode zur ein- 
deutigen Identifizierung und Charakterisierung essentieller Gene. Da essen- 
tielle Gene ein naturliches Ziel fur inhibierende Wirkstoffe darstellen, bieten 
die dargestellten Verfahren eine ideale Grundlage fur die Entwicklung neuer 
Wirkstoffe. 

In den nachfolgend beschriebenen Verfahren werden die identifizierten Gene 
direkt zum Wirkstoff-Screening eingesetzt, wobei im Vergleich zu herkdmm- 
lichen Verfahren, auf aufwendige Aufreinigungsschritte verzichtet werden 
kann. Im Mittelpunkt dieser Verfahren stehen bakterielle Tragerzellen, die 
zum Screening nach prophylaktischen und therapeutischen Wirkstoffen 
eingesetzt werden konnen. 

Die hergestellten gendefizienten Mikroorganismen werden dann auf ihre 
Wachstumsfahigkeit oder ihre Uberlebensfahigkeit getestet. Geeignete 
Testsysteme sind z.B. /n-wYro-Systeme, Zellkultursysteme, Gewebekultur- 
systeme und Tiermodelle als naturliche Umgebung. Wird das Verfahren bei 
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H. pylori angewandt, werden die Organismen einerseits auf einem sog. 
Vollmedium angezuchtet, wobei das Vollmedium die bestmoglichen Voraus- 
setzungen fur ein Wachstum fur Mpy/or/ermoglicht. Gleichzeitig werden die 
defizienten H. pylori Organismen in einer Kultur geziichtet, welche der 
naturlichen Umgebung von H. pylori moglichst genau entsprechen soli. Es 
werden hierzu einerseits Zellkulturen basierend auf Primarkulturen oder 
Zellinien aus gastrointestinalem Gewebe verwendet oder aber ausdifferen- 
ziertes Primargewebe (Spharoide) in Kulturmedium. Weitere Moglichkeiten 
zur Simulation der naturlichen Umgebung von H. pylori bestehen in der 
Verwendung von stimulierten Makrophagen, denn H. pylori besitzt die 
Fahigkeit, von diesen nicht aufgenommen und metabolisiert zu werden. 
AuBerdem kann auch uberpruft werden, ob die defizienten H. pylori 
Organismen in der Lage sind, sich in immundefizienten Mausen uber einen 
bestimmten Zeitraum zu etablieren. 

1st ein defizientes H. pylori Bakterium zwar in der Lage, auf Vollmedium zu 
uberleben, wachst aber nicht in einer naturlichen Umgebung, wie oben 
beschrieben, so wird das in diesem Organismus defiziente Gen als fakultativ 
essentielles Gen bezeichnet. 

Wenn der defiziente H. pylori Organismus in keinem der beiden Testlebens- 
raume uberlebensfahig ist, so handelt es sich um ein obligat essentielles 
Gen. 

Allgemein konnen Gene von Mikroorganismen einer dieser Kategorien 
zugeordnet werden. 

Aus diesen Ergebnissen konnen dann die in mutierten oder/durch asRNA 
unterdruckten Sequenzen identifiziert und jeweils einer dieser beiden 
Kategorien zugeordnet werden, oder aber der Kategorie der nichtessentiellen 
Gene, wenn der gendefiziente Organismus keine Beeintrachtigungen in 
seiner Wachstumsfahigkeit zeigt. 
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Eine weitere Aufgabe der vorliegenden Erfindung ist es, ein genetisches 
Verfahren zur Isolierung und Klonierung der identifizierten essentiellen Gene 
aus verschiedenen klinischen Helicobacter Isolaten bzw. aus heterologen 
pathogenen Keimen von klinischer Bedeutung bereitzustellen. Das 
erfindungsgemalSe Verfahren umfafct daher weiterhin die Schritte 
(v) Herstellen von Primern zur Amplifikation und Detektion von 

homologen Gensequenzen in heterologen Mikroorganismen 
(VI) Identifizieren der homologen Gensequenzen. 

Eine bevorzugte Durchfuhrung dieser weiteren Verfahrensschritte besteht 
darin, sogenannte Megaprimer von den identifizierten essentiellen 
Helicobacter-Qenen mittels PCR (Polymerase Chain Reaction) herzustellen, 
deren Sequenz direkt aus den entsprechenden Plasmiden der 
mutagenisierten DNA-Abschnitte abgeleitet werden kann. Diese Primer 
konnen dann verwendet werden, um die bereits identifizierten essentiellen 
Gene aus verschiedenen Heficobacter-\so\aten zu isolieren. Falls diese 
essentiellen Gene Entsprechungen in anderen Mikroorgansimen haben, 
konnen die Primer unter Umstanden auch zur Isolierung dieser Gene aus von 
HeficobacterverscWiedenen Mikroorgansimen verwendet werden. Weiterhin 
kann dann die genaue DNA-Sequenz der isolierten Gene und die Feststellung 
der Genvarianz innerhalb der verschiedenen HelicobacterAso\a\e bzw. 
zwischen den verschiedenen Mikroorganismen bestimmt werden. 
Bei der Herstellung der Megaprimer entstehen DNA-Fragmente mit variablen 
3'-Enden. Aufgrund dieser Eigenschaft ist es moglich, die DNA-Fragmente 
zur Isolierung variabler, bzw. verwandter Gene mittels des beschriebenen 
PCR-Verfahrens einzusetzen. 

Identifizieren von spezifischen Wirkstoffen 

Zur Identifizierung neuer immunologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe werden bakterielle Trager insof em sehr 
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wirksam eingesetzt, da die identif izierten Gene direkt in diese Tragersysteme 
kloniert und dort exprimiert werden konnen. Das Wirkstoff-Screening 
erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen Trager. Als 
Trager werden bevorzugt attenuierte Bakterien, wie z.B. Salmonellen, 
verwendet, da diese uber ein naturliches Potential zur Immunstimulanz 
verfugen. Werden diese attenuierten Bakterien. als Trager bzw. 
Produzenten fur die identifizierten essentiellen Gene der pathogenen Keime 
verwendet und wird mit diesen Impfstammen eine Immunisierung an einem 
Saugetier durchgefuhrt, so kann eine nachhaltige Immunantwort ausgelost 
werden. 

Mittlerweile sind die immunologischen Eigenschaften dieser bakteriellen 
Tragersysteme so weit verfeinert worden, daS eine gezielte Immunantwort 
ausgelost werden kann (VanCott et al., 1 998; Carrier-Patent EP981 1 6827. 
1). Diese Eigenschaft ist insofern bedeutsam, da die verschiedenen 
Krankheitserreger oftmals nur uber einen bestimmten Zweig des 
Immunsystems wirksam bekampft werden konnen. D.h. schutzvermittelnde 
Antigene lassen sich nur dann identifizieren, wenn sie dem Immunsystem 
in der richtigen Form prasentiert werden. Nur wenn der verwendete Trager 
mit einem wirksamen Antigen beladen wurde, kann es zu einer 
Schutzwirkung kommen. Aufgrund der vielfaltigen immunologischen 
Eigenschaften bakterieller Tragersysteme und deren Uberlegenheit 
gegenuber herkommlichen synthetischen Adjuvantien sind diese zur 
Identifizierung immunologisch relevanter Antigene besonders geeignet. 

Dariiber hinaus konnen die bakteriellen Tragersysteme mit effizienten 
Genexpressionssystemen ausgestattet werden, welche die Herstellung auch 
problematischer Antigene erlauben (PCT/EP9 1/02478, EP981 1 6827.1 ). 
Aufgrund der direkten Subklonierung der isolierten essentiellen Gene und 
der einfachen Handhabung der bakteriellen Trager bei der Herstellung und 
Vakzinierung, konnen in relativ kurzer Zeit eine groSe Anzahl von Antigenen 
hinsichtlich ihres immunogenen und protektiven Potentials durchgetestet 
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werden. In herkommlichen Verfahren mussen die Test-Antigene dagegen 
zeitaufwendigen Aufreinigungsverfahren iinterworfen werden, wobei 
oftmals schon bei der gentechnischen Herstellung der ausgewahlten 
Antigene in Bakterien Schwierigkeiten auftreten, die mit der toxischen 
Wirkung dieser Antigene auf den produzierenden Bakterienstamm verknupft 
sind. 

Eine wichtige Voraussetzung fur das Entwickeln von Wirkstoffen besteht 
darin, das immunogene Potential der identifizierten Sequenzen festzustellen, 
um zu bestimmen, inwiefern die entsprechenden Genprodukte fur die 
Herstellung von Antikorpern oder Impfstoffen geeignet sind. 

Zur Identifizierung immunologischer Wirkstoffe gegen klinisch relevante 
Helicobacter-Oxgariismen mute zunachst ermittelt werden, in wie weit das 
Genproduktdes identifizierten essentiellen Gens immunogene Eigenschaften 
besitzt. D.h. es muB experimentell ermittelt werden, ob mit dem Antigen 
eine humorale und zellulare Immunantwort in einem Saugetier ausgelost 
werden kann, die gegen das originale Genprodukt des Erregers gerichtet ist. 
Damit werden auf keinen Fall solche Antigene ausgeschlossen, die im 
Rahmen einer natiirlichen Infektion vom Immunsystem nicht erkannt 
werden. Im Gegenteil, vielmehr konnte man erwarten, daB z.B. bei 
chronisch infizierten Menschen die Immunantwort gegen schutzvermittelnde 
Antigene unterdriickt ist oder von einer Qualitat ist, die letztendlich keine 
Schutzwirkung vermittelt. Auszuschliefcen sind jedoch solche Antigene, die 
einer hohen genetischen Variation unterliegen und somit einer wirksamen 
Immunantwort kaum zuganglich sind. 

Zum Nachweis der Identitat des identifizierten Genprodukts bei einer 
naturlich vorkommenden Infektion, wird Antiserum von Patienten 
gewonnen, die entweder unter einer aktiven Gastritis mit Beschwerden 
leiden, oder aus Patienten, bei denen die/fe//co£acfer-lnfektion symptomlos 
verlauft. Mit diesen Seren wird das elektrophoretisch aufgetrennte 
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rekombinante Protein in einem klassischen Western Blot Verfahren getestet. 
Findet eine Erkennungsreaktion mit einem rekombinanten Protein jeweils mit 
beiclen Seren, also dem eines Patienten mit einer fulminanten und dem eines 
Patienten mit einer symptomlosen Helicobacter Infektion, statt, so spielt 
dieses Protein bei einer naturlichen Infektion eine Rolle. Wird das 
rekombinante Polypeptid dagegen nur von dem Serum des Patienten mit 
einer symptomlosen Infektion erkannt, kann das zusatzlich ein Hinweis auf 
ein protektives Potential des entsprechenden Proteins sein. Weiterhin 
konnen Antikorper, die gegen dieses Protein spezifisch gerichtet sind, 
moglicherweise zur passiven Immunisierung eingesetzt werden. 

Von besonderem Interesse sind aufSerdem Antikorper von Individuen, die 
nachweislich keine He/icobacter-Trager sind, da diese auf ein protektives 
Potential eines entsprechenden rekombinanten Polypeptids schlieBen lassen. 

Desweiteren werden die immunogenen Polypeptide zusammen mit 
geeigneten Zusatzstoffen zur Immunisierung in vivo eingesetzt. Verwendet 
werden dazu verschiedene Adjuvantien, bakterielle Toxine, Zytokine oder 
ein erfindungsgemaBes Polypeptid als Lebendvakzin. Die Immunantwort 
wird daraufhin getestet, ob sie nach einer erfolgten Verabreichung eines 
bestimmten Polypeptids der Erfindung in Kombination mit entsprechenden 
Zusatzstoffen nach Infektion mit dem homologen Keim eine schutzende 
Wirkung gegen weitere homologe Infektionen herbeifiihrt (z.B. Infektionen 
mit verschiedenen H. pylori Stammen). 

Noch eine weitere Moglichkeit zum Testen der Immunogenitat besteht darin, 
im Tiermodell (z.B. Maus, Kaninchen) eine Immunantwort gegen 
Helicobacter oder andere Mikroorganismen auszulosen und aus den 
immunisierten Tieren Antikorper zu gewinnen, die dann in einer weiteren 
Western-Blot-Analyse verwendet werden konnen. Gleichzeitig mussen 
Patientenbiopsien in situ immunologisch mit den gleichen Antikorpern 
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untersucht werden, da Helicobacter und andere Mikroorganismen in Kultur 
bestimmte Proteine verlieren oder hinzugewinnen konnen. 

Parallel dazu ist es bevorzugt zu untersuchen, ob gegen eine Infektion mit 
heterologen Keimen (bevorzugt andere gram-negative Bakterien), welche 
das entsprechende Polypeptid exprimieren, eine schutzende Wirkung erzielt 
werden kann. 

Nachdem festgestellt wurde, ob die identifizierten Gene bzw. deren 
Expressionsprodukte in der Lage sind, eine Immunantwort hervorzurufen, 
kann gemafc dem Verfahren der Erfindung weiterhin untersucht werden, ob 
auch eine bereits bestehende Infektion mit derartigen Antigenen behandelt 
werden kann. Kann auf diese Weise ein Polypeptid identifiziert werden, das 
eine therapeutische Wirkung zeigt, wird es bevorzugt auch auf seine 
Aktivitat bei Infektionen mit heterologen Keimen untersucht. 

Das Screening nach prophylaktisch bzw. therapeutisch wirksamen, 
immunologischen Stoffen kann nach folgendem Schema verlaufen, wobei 
die Einhaltung der einzelnen Schritte nicht zwingend ist: 

1 . Klonierung des identifizierten Gens in einen geeigneten bakteriellen 
Tragerstamm und Nachweis sowie Quantifizierung des vollstandigen 
Genprodukts durch SDS-PAGE. 

2. Immunologische Charakterisierung des erzeugten Genprodukts mit 
Hilfe von (a) Seren infizierter oder/und naturlich geschutzter Wirte, 
die das Genprodukt im Tragerstamm erkennen sollte; (b) 
Hyperimmunseren von Tieren, die mit dem rekombinanten 
Tragerstamm immunisiert wurden. Wobei das jeweilige 
Hyperimmunserum das originale Genprodukt im pathogenen Keim 
erkennen sollte. Hierbei kann es moglich sein, date das originale 
Antigen nur in einem bestimmten Entwicklungszeitraum vom 
Pathogen produziert wird. 
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3. Die protektive Wirkung der individuellen Antigene in der 
prophylaktischen oder/und therapeutischen Anwendungsform wird im 
Tiermodell untersucht. 

Alle protektiven Antigene, die mit den beschriebenen Verfahren identifiziert 
wurden, konnen nunmehr in einem zweiten Schritt weiterentwickelt werden, 
Im Vordergrund dieser Weiterentwicklung steht u. a. die Evaluierung der 
genetischen Konstanz der identifizierten protektiven Antigene innerhalb des 
Pathogens bzw. verwandter pathogener Keime in seiner weltweiten 
Verbreitung. Weiterhin wird zur Entwicklung wirksamer Impfstoffe, auf die 
genetischen Unterschiede im Immunsystem der Impflinge eingegangen. Ziel 
beider Verfahren ist die Identifizierung von Antigenen oder Epitopen, die 
moglichst breit angewendet werden konnen. Zur Erfassung der 
Genvariabilitat innerhalb einer Spezies bzw. homologer Keime kann der 
sogenannte Mega-Primer-Ansatz eingesetzt werden. Aus dem Plasmid mit 
dem relevanten Gen werden direkt genspezifische Primer mit variablen 3'- 
Enden uber PCR hergestellt, welche die Amplifikation homologer Gene 
ermoglichen. Anhand der ermittelten DNA-Sequenz der amplifizierten Gene 
kann deren Variabilitat abgeleitet und z.B. genkonstante Bereiche bestimmt 
werden. 

Die genetischen Unterschiede zwischen einzelnen Impflingen, auf ein 
definiertes Antigen zu reagieren, kann mit Hilfe einer In Wfro-Vakzinierung 
evaluiert werden. Aus unterschiedlichen Spendern werden hierzu 
antigenprasentierendeZellen (APC) isoliert,z.B.dentritischeVorlauferzellen, 
welche in vitro expandiert und mit den zu testenden Antigenen beschickt 
werden, wobei die Antigene bevorzugt uber entsprechende Vektoren 
exprimiert werden. Die identifizierten Gene konnen auch einzeln oder in 
definierten Kombinationen in dendritischen Zellen (DC) von nicht infizierten 
Spendern exprimiert werden. Dabei werden die Genprodukte von der 
Wirtszelle prozessiert und durch den MHC-Komplex prasentiert. DC sind 
besonders fur die Antigenprasentation gegenuber naiven oder 
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"schlummernden" T-Zellen geeignet. Werden DC mit T-Zellen autologer 
Spender inkubiert, ist es moglich zu bestimmen, ob dieser Spender gegen 
das eingesetzte Antigen reagieren wurde, wenn er auf naturliche Weise 
damit in Kontakt kame, z.B. im Rahmen einer Schutzimpfung. Anhand der 
Immunantwort der T-Zellen kann auf eine mogliche Immunogenitat des 
entsprechenden Antigens geschlossen werden. Eine solche Immunantwort 
besteht beispielsweise aus einer Proliferation der T-Zellen, bzw. einer 
Zytokin-Ausschuttung insbesondere von IL-2 und IL-4. Die Zytokine konnen 
beispielsweise mit Hilfe eines kommerziell erhaltlichen Assaykits (z.B. von 
Genzyme Cambridge M.A.) ausgewertet werden. 

SchlieSlich konnen die in der beschriebenen Weise identifizierten und 
charakterisierten Antigene bzw. Epitope zur Entwicklung der ersten 
Impfstoff-Prototypen eingesetzt werden. Hierbei wird zwischen zwei 
Impfstofftypen unterschieden, der aktiven und der passiven Impfung. 

Zur passiven Immunisierung, werden dem Impfiing Antikorper oder 
Antikorperf ragmente mit schutzender bzw. inhibierender Wirkung von auSen 
zugefuhrt. 

Antikorper werden in Form von polyklonalen, bevorzugt monoklonalen 
Antikorpern (MAKs) oder rekombinanten Antikorpern bereitgestellt. Hierzu 
gehoren Antikorper, die spezifisch mit Polypeptiden der Erfindung oder 
deren Untereinheiten und Fragmenten reagieren und fur eine prophylaktische 
und/oder therapeutische Anwendung, z.B. einer passiven Immunisierung, 
verwendet werde konnen. Diese Anti-Protein- oder Anti-Peptid-Antiseren 
bzw. monoklonalen Antikorper konnen mit Hilfe von Standardprotokollen 
z.B. durch die Immunisierung von Tieren wie Mausen, Ratten oder Ziegen 
mit einem gereinigten Polypeptid der Erfindung, einen Fusionsprotein oder 
einem Subfragment dessen hergestellt werden. Daruber hinaus konnen die 
Tiere auch mit bakteriellen Vakzinetragern immunisiert werden, die mit 
entsprechenden Genen der Erfindung ausgestattet sind und die kodierten 
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Polypeptide exprimieren. Die Antikorper sind dabei bevorzugt 
immunspezifisch gegen antigene Determinanten oder Epitope hierzu der 
beschriebenen /ye//co6acter-Polypeptide oder einem eng verwandten 
Polypeptid, das eine Homologie von mindestens 90% besitzt, gerichtet. Sie 
sind nicht kreuzreaktiv mit Polypeptides die z.B. eine Homologie von 
weniger als 80% aufweisen. 

Ausgehend von einer Zellinie, die einen Polypeptid-spezifischen 
monoklonalen Antikorper produziert, kann aus dem kodierenden Gen eines 
solchen Antikorpers, chimare Gene geschaffen werden, die Antikorper 
determinieren, bestehend aus einer Antigen bindenden Domane aus der 
Maus und dem Fc-Teil eines Antikorpers des Menschen. Diese Antikorper 
konnen in Zellinien oder transgenen Tieren produziert werden. 

Anstelle von Antikorpern, die im Tier generiert wurden, konnen auch 
Antikorper-Fragmente, Miniantikorper, verwendet werden, die z.B. in einem 
heterologen System wie Bakterien hergestellt werden. Diese Miniantikorper 
konnen entweder monovalent oder bivalent sein und bestehen aus 
dimerisierten Einzelketten-Molekulen (Kujau et al., 1998; Kalinke et al., 
1996; Pack et al., 1993). 

Antikorper gegen die immunogenen Polypeptide der Erfindung konnen auch 
in Pflanzen generiert werden. Beispiele hierzu sind z.B. von Hiatt und Ma 
(1 993), van Engelen etal. (1 994) und Ma et al. (1 994) beschrieben worden. 
Entsprechend der jeweilig verwendeten Pflanze konnen diese z.B. direktzum 
Verzehr und damit als orales Vakzin verwendet werden. 

Eine weitere, sehr breit anwendbare Weise, Antikorper herzustellen, ist in 
Milch und Eiern immunisierter Tiere. Verabreicht man z.B. trachtigen Kuhen, 
Schafen oder Pferden geeignete Antigene, so finden sich in der Milch 
Immunoglobulins die zur Entwicklung eines Vakzins verwendbar sind. Die 
Milch kann dann entweder direkt als Vakzin verabreicht werden, oder ein 
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konzentriertes Immunglobulin-Extrakt hergestellt werden. Auf die gleiche 
Weise kdnnen auch Antikorper (Hyperimmunantikdrper) in Huhnereiern 
produziert werden (Ling et al., 1 998; Sasse et al., 1 998). Die beschriebenen 
immunogenen Polypeptide der Erfindung konnen daher auch zur Entwicklung 
eines Milchprodukts oder Huhnereiern verwendet werden, die als orales 
Vakzin verwendet werden konnen. 

ErfindungsgemaS werden die generierten Antikorper oder deren Fragmente 
auf ihre An wendbarkeit getestet. Sie konnen dazu durch bekannte Verfahren 
auf gereinigt werden (Prazipitation, chromatographische Verfahren) und bei- 
spielsweise darauf untersucht werden, ob sie den Infektionsvorgang von H. 
pylori inhibieren konnen (Adhasionsassays) oder aktivierend auf Komple- 
ment oder AQCC ("antibody-dependent cell-mediated cytotoxicity" , anti- 
korperabhangige zellvermittelte Zytotoxizitat) wirken. 

Zur passiven Immunisierung werden die Antikorper, die mit Hilfe der 
Polypeptide der Erfindung generiert wurden, entweder oral oder intra- 
gastrisch verabreicht. Hierfur werden die Antikorper mit einem Bicarbonat- 
Puffer gemischt. Sie konnen aber auch systemisch verabreicht werden, 
wobei sie nicht gepuffert werden mussen. 

Antikorper werden bevorzugt allein oder auch in Kombination mit anderen 
nicht-immunologischen Wirkstoffen verwendet, z.B. mit Antibiotika oder 
Protonenblockern. 

Aktive Vakzinierung beruht auf einer Immunreaktion, die vom geimpften 
Organismus selbst ausgelost wird. Bevorzugt sind Darreichungsformen von 
Impfstoffen als Antigene, Antigenfragmente, Subunit-Vakzin, als DNA- 
Vakzin, als Lebend-Vakzin oder als Lebensmittel-Vakzin. 

Antigene sind diejenigen Polypeptide oder deren Fragmente, die in vivo eine 
Immunreaktion hervorrufen konnen. 
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Wenn ein Polypeptid als Subunit-Vakzin bereitgestellt werden soil, wird es 
zunachst in seine Untereinheiten bzw. Strukturdomanen gemafc seines 
Antigenitatsmusters zerlegt (z.B. T- und B-Zell-Epitope). Dieses 
Antigenitatsmuster kann mit Hilfe eines Computerprogramms erstellt 
werden, wobei immunogene Regionen, die aus einer kurzen Polypeptid- 
sequenz von ca. 8 bis 10 Aminosauren bestehen, erkannt werden konnen 
(Hughes et aL, 1992). Die einzelnen Polypeptidstucke konnen dann 
anschlieBend auf ihre Immunogenitat in der Maus oder in Primaten bzw. den 
Menschen getestet werden. Sie konnen dazu entweder als gereinigte 
Polypeptide, die synthetisch hergestellt wurden, in Kombination mit 
entsprechenden Zusatzstoffen wie einem Adjuvans, Toxin oder Cytokin 
verabreicht werden, oder als Fusionsprotein an ein bekannt immunogenes 
Protein bzw. Proteinuntereinheit wie z.B. die Cholera Toxin B Untereinheit 
(Liljeqvist et aL, 1997) gekoppelt. Weiterhin konnen die immunogenen 
Peptide in auBere Membranproteine wie z.B. dem OmpS Maltoporin von 
E.coli eingebaut und heterolog in einem Vakzin-Tragerstamm exprimiert 
werden (Lang und Korhonen, 1997). 

Zur Entwicklung eines DNA-Vakzins konnen die in der Erfindung 
charakterisierten Polynukleinsaure-Molekule "nackt" in Fusion mit einem 
eukaryontischen gewebespezifischen Promoter oder in Form eines Plasmids 
verabreicht werden. Die "nackte" DNA oder das entsprechende Plasmid 
wird in Kombination mit einem Zusatzstoff wie einem Reagenz, das die 
zellulare Permeabilitat verandert wie z.B. Bupivacain (W094/1 6737), 
kationischen Lipiden wie z.B. DOTMA (N-[1-(2,3-dioleyloxy)propyl]-N,N,N- 
trimethyl-ammoniumchlorid, DOTAP (1 ,2-bis(oleyloxy)-3-trimethyl- 
ammonio)propan), DDAB (dimethyl-dioctadecyl-ammoniumbromid), DOGS 
(dioctadecyl-amidolglycyl-spermidin) bzw. Cholesterinolderivaten, Silica, 
Gold oder Wolfram (Tang eta/. 1992) bzw. in Liposomen (W093/18759, 
W093/19768, WO94/25608, W095/2397) oder Mikropartikeln verpackt, 
verabreicht. Beispiele fur brauchbare Promoteren und Genfahren sind von 
Hartikka et aL (1996) beschrieben worden. Zur Applikation der 
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Polynukleotid-Molekule konnen jedoch auch z.B. attenuierte Salmonellen 
verwendet werden. Die Bakterien werden hierfur mit eukaryontischen 
Expressionsvektoren, die ein Polynukleotid-Molekul der Erfindung beinhalten, 
transf ormiert und dann oral verabreicht. Die Plasmid-DN A wird anschliefSend 
vom Bakterium auf den Wirt ubertragen (Darji et aL, 1997). Zur 
Transformation attenuierter Tragerbakterien konnen jedoch auch filamentose 
Phagen verwendet werden. Der Vorteil dieser liegt darin, da& sie eine 
extrem hohe Anzahl von Plasmiden ubertragen konnen. 

Fur die Entwicklung eines Lebendvakzins stehen unter anderem virale, wie 
z.B. adenovirale oder Windpocken-Virus-Vektoren, bzw. bakterielle Vektoren 
wieetwa Salmonella, Shigella oder LactobaciffuszurVerfugung. Attenuierte, 
nichtvirulente Salmonella typhimurium-Stamme, die zur rekombinanten 
Expression heterologer Antigene benutzt werden konnen und oral 
verabreicht werden, wurden vielfach charakterisiert {Mekalanos, 1994, 
W092/1 1361, Cirillo et aL, 1995 und Dorner (1995). Weitere bakterielle 
Vektoren, die als Vakzinvektoren verwendet werden konnen, sind von Cirillo 
et aL, (1995) und Dorner (1995) beschrieben worden. Ein Polynukleotid- 
Molekul der Erfindung, das fur ein therapeutisch oder prophylaktisch 
wirksames Polypeptid kodiert, wird hierzu entweder in das bakterielle 
Genom stabil integriert und einem Transportsystem unterworfen, das die 
Darbietung an der bakteriellen Oberflache ermoglicht (PCT/EP94/04286; 
WO97/35022). Das entsprechende Polynukleotid-Molekul kann im 
Bakterium aber auch als Plasmid in freiem Zustand vorliegen. 

Impfstoffe werden in der Regel mit geeigneten Zusatzstoffen wie z.B. 
Adjuvantien, bakteriellen Toxinen, Zytokinen etc. verabreicht, die das 
immunogene Polypeptid in seiner protektiven oder therapeutischen Wirkung 
unterstutzen. Adjuvantien mit geringen Nebenwirkungen zur Verwendung 
im Menschen, die fur Subunit-Vakzine und Lebend-Vakzine, aber zum Teil 
auch fur DNA-Vakzine in Frage kommen, sind z.B. Aluminiumhydroxid, 
Aluminiumphosphat, Calciumphosphat, N-Acetyl-muramyl-L-threonyl-D- 
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isoglutamin, N-Acetyl-normuramyl-L-alanyl-D-isoglutamin, N-Acetyl- 
muramyl-L-alanyl-D-isoglutamyl-L-alanin-2-(1 '-2'-dipalmitoyl-sn-glycero-3- 
hydroxyphosphoryloxy)-ethylamin, Liposomen, Monophosphoryl-Lipid A, 
Trehalosedimicoloat, Pilz-Polysaccharide wiez.B. Schizophyllan, Muramyl- 
Dipeptid, Muramyl-Dipeptid-Derivate, sowie Phorbolester, Saponine und 
immunstimulierende Komplexe (ISCOMS) (Gupta und Siber, 1995). Als 
bakterielles Toxin kann z.B. Cholera Toxin bzw. dessen Untereinheiten oder 
das hitzelabile Toxin aus E.coli verwendet werden. Obwohl diese 
hochpotent als Adjuvantien aktiv sind, konnen sie aufgrund ihrer Toxizitat 
nur begrenzt auf den Menschen angewendet werden. Mit Hilfe bestimmter 
Mutagenesetechniken konnen jedoch Molekule entwickelt werden, die aktiv, 
aber ungiftig sind (O'Hagan, 1998). 

Eine weitere Moglichkeit, die Immunantwort auf die prophylaktisch und/oder 
therapeutisch wirksamen Substanzen der Erfindung zu optimieren, ist, das 
entsprechende Polypeptid als Fusionsprotein mit einer immunogenen 
Proteindomane zu exprimieren. Eine Moglichkeit besteht z.B. darin, die Pilin 
DSL-Domane aus Pseudomonas aeruginosa als Fusionspartner zu 
verwenden. Weiterhin beschrieben sind Fusionsproteine, die an Glutathion 
S-Transferase oder Thioredoxin fusioniert wurden (Hill et al., 1997; 
Gabelsberger et al., 1997). Das entsprechende Fusionsprotein kannjeweils 
als Subunit- oder Lebendvakzin hergestellt und verabreicht werden. 

Die Immunantwort der identif izierten immunologisch wirksamen Substanzen 
kann auch insbfern moduliert werden, indem diese in Kombination mit 
bestimmten Zytokinen verabreicht werden. Zur simultanen Verabreichung 
bietet sich eine Co-Expression der Polynukleotid-Sequenzen der Erfindung 
mit einem bestimmten Cytokin in Salmonella oder einem anderen 
Wirtsbakterium an. Das entsprechende Cytokin kann hierzu entweder auf 
einem separaten Plasmid, in Reihe oder als Fusionsprotein mit der 
gewunschten Polynukleotid-Sequenz der Erfindung kodiert sein und dann in 
das Wirtsbakterium transformiert werden. In Frage kommen Cytokine, die 
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wie z.B. lnterleukin-6 (IL-6), Interleukin-1 0 (IL-1 0) oder lnterleukin-1 2 (IL-1 2) 
das Immunsystem stimulieren. 

Zur weiteren Optimierung konnen einzelne immunogen wirksame 
Substanzen der Erfindung miteinander oder in Kombination mit bekannten 
immunogenen Substanzen wie z.B. VacA bzw. dessen einzelne 
Untereinheiten kombiniert werden. Das entsprechende Polypeptid kann also 
gemeinsam mit mindestens einem weiteren Helicobacter Antigen, wie z.B. 
der nativen Urase oder deren Untereinheiten, Fragmenten Homologen, 
Mutanten oder Derivaten derselben exprimiert werden. AuBerdem konnen 
z.B. verschiedene Subunit-Vakzine einzeln oder als Fusionsprotein wie 
weiter oben beschrieben gemeinsam verabreicht werden. Hierfur konnen 
wiederum z.B. gereinigte Polypeptid-Molekule in Kombination mit einem 
geeigneten Adjuvans, bakteriellen Toxin oder Cytokin verwendet werden. 
Weiterhin konnen diverse Kombinationen von Nukleotid-Sequenzen 
immunogener Untereinheiten der beschriebenen Polypeptid-Molekule auf 
einem gemeinsamen Plasmid hergestellt und als Lebendvakzin verabreicht 
werden. Ein Vakzinvektor der Erfindung kann also ein oder mehrere 
Polypeptide der Erfindung, Derivate bzw. Fragmente dergleichen enthalten. 
Au&erdem besteht die Moglichkeit der Kombination eines DNA-Vakzins mit 
ein oder mehreren gereinigten Subunit-Vakzinen in einer geeigneten 
Tragersubstanz, wie bereits weiter oben beschrieben wurde. 

Zur Identifizierung neuer pharmakologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe konnen ebenfalls bakterielle Trager sehr 
wirksam eingesetzt werden, da die identifizierten Gene direkt in diese 
Tragersysteme kloniert und dort exprimiert werden konnen. Das Wirkstoff- 
Screening erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen 
Trager. 
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Display-Systeme dienen dazu, ein exprimiertes Polypeptid der Erfindung an 
der Zelloberflache von Bakterien zu prasentieren. Den Transport von 
Polypeptiden durch die innere Membran ermoglicht ein Signalpeptid am 
Aminoende, wahrend andere Anteile die Einlagerung und Verankerung in der 
auSeren Membran ubernehmen. Als Trageranteile sind verschiedene aufcere 
Membranproteine von E.coli beschrieben worden wie z.B. PhoE (Agterberg 
eta/., (1990) oder OmpA (Francisco eta/., 1992). Es konnen jedoch auch 
Fusionen mit der Transportdomane des IgA-Proteasevorlaufers IgAfc 
verwendet werden (Klauser eta/. , 1 990) . Beispiele fur Display-Systeme sind 
z.B. das DsbA-System (PCT/EP 94/02486) oder das Autotransporter-System 
(AIDA; WO97/35022). Die an der Oberflache prasentierten Polypeptide 
konnen dann fur Bindungsstudien mit Peptid- oder kombinatorischen 
chemischen Substanzenbanken verwendet werden. Die Bindungsstudien 
konnen mit Hilfe eines "High Through Put" Systems, das hohe Testraten 
ermoglicht, in Flussigkeit oder aber gebundener Form durchgefuhrt werden. 
Hierfiir werden die prasentierten Polypeptide z.B. an ein Chromatophor 
gekoppelt, das in Kombination mit einem weiteren Chromatophor, das an 
das Wirkstoff-Peptid oder die chemische Substanz gekoppelt ist, eine 
Farbreaktion ermoglicht. Die entsprechende Wirkstoffkomponente kann 
jedoch auch z.B. mit einem Fluoreszenzfarbstoff markiert oder an eine feste 
Tragermatrix gekoppelt sein. Bei Verwendung eines "Solid Phase Systems" 
wird vorher entweder das verwendete Polypeptid der Erfindung oder aber 
umgekehrt die Peptid- bzw. kombinatorische Wirkstoffbank an die 
Tragermatrix gekoppelt. Die jeweilige farbstoffmarkierte Komponente bindet 
dann an die immobilisierte Komponente, wodurch wieder eine Farbreaktion 
ermoglicht wird. Nach der Bindungsreaktion miissen dann mehrere 
Waschvorgange vollzogen werden, bevor die entsprechende Substanz 
isoliert wird. Vorteil des "Solid Phase Systems" gegenuber der Bindung in 
Flussigkeit ist, da(S die wirksame Substanz schneller isoliert werden kann, 
da die ungebundenen Substanzen weggewaschen sind. 
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Weitere Verfahren zur Identifizierung neuer pharmakologischer Wirkstoffe 
basieren auf den Kenntnisse aus der Primarstruktur der identifizierten 
essentiellen Gene bzw. benutzen die aufgereinigten gentechnisch 
hergestellten Genprodukte. 

Eine alternative Ausfuhrungsform des erfindungsgemaSen Verfahrens 
besteht darin, spezifische Bindepartner der von den identifizierten Genen 
kodierten Polypeptide zu finden. 

Es konnen bevorzugt Homologiestudien mit Helicobacter und anderen 
Organismen durchgefuhrt werden, z.B. mit Hilfe von Computer-Alignments, 
Southern Blots, PCR und dgl. und anschlieSender Zuordnung der 
Sequenzen. Aufgrund von Homologien kann dann auf potentielle 
Bindepartner der Proteine geschlossen werden. 

Ebenfalls bevorzugt konnen auch kombinatorische Bindungsstudien uber 
Target-gerichtetes-Screening-Verfahren mit Hilfe von Substanzen- 
Bibliotheken durchgefuhrt werden. Die potentiellen bindenden Substanzen 
werden in einer speziellen Anordnung gebunden vorgelegt, z.B. in 
Mikrotiterplatten oder anderen Tragermaterialien. AnschlieBend wird das 
"Target", in der Regel aufgereinigte, gegebenenfalls rekombinante 
He/icobacter-Prote'ine, in loslicher Form hinzugegeben, was den Nachweis 
einer Wechselwirkung zwischen dem Target und bestimmten Substanzen 
ermoglicht. Ein indirekter Nachweis kann durch markierte Antikorper, die 
gegen die Substanz gerichtet sind, oder durch Einfuhren zusatzlicher 
Elemente ("Tags") in das Target erbracht werden. 

Eine weitere Variante der Bindungsstudien besteht in der Expression von 
He/icobacter-Proteinen in rekombinanten Bakterien (z.B. solche, die das 
fluoreszierende Protein GFP oder bestimmte Enzyme herstellen), welche die 
Proteine auf der Oberflache prasentieren, und anschlieBendes Testen einer 
Substanzen-Bibliothek. 
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Weiterhin kann die dreidimensionale Struktur der von den 
erfindungsgemaSen identifizierten Genen kodierten Polypeptide oder deren 
Fragmente auch durch kristallographische Analyse ermittelt werden. Bei 
ausreichender Auflosung konnen eventuelle "Taschen" oder sonstige 
Bindestellen in ihrer dreidimensionalen Struktur exakt charakterisiert werden. 
Aufgrund dieser Daten kann die Struktur potentieller Bindepartner berechnet 
werden. 

Mit Verfahren, wie etwa "Two-hybrid System", Display-Systemen, "High 
Throughput Screening" oder kombinatorischen Bindungsstudien konnen 
zufallig generierte Polypeptide identifiziert werden, die an die Helicobacter 
Polypeptide der Erfindung oder deren Fragmente, oder an weitere 
erfindungsgemaS identifizierte Polypeptide binden. Wird auf diese Weise ein 
entsprechendes Peptid gefunden, kann dieses chemisch weiter modifiziert 
werden, bis die optimale mogliche Bindung erreicht ist. Das identifizierte 
Polypeptid kann z.B. als Inhibitor verwendet werden, indem es z.B. an ein 
Toxin und ein Internalisierungssignal gekoppelt wird, das den pathogenen 
Keim zerstort oder aber als Peptidmimetikum, um das Binden des Keims an 
die zellulare Oberflache zu verhindern (EP-41 2,762A und EP-B3 1 ,080A) . Mit 
Hilfe des "Two Hybrid Systems" konnen aber auch Aktivatoren des 
Immunsystems generiert werden. Die identifizierten Peptide, die an die 
Helicobacter Polypeptide der Erfindung binden, konnen hierzu an bestimmte 
Liganden z.B. fur den T-Zell-Rezeptor gekoppelt werden. Werden also einem 
von Pathogenen befallenen Tier oder Menschen diese so ausgestatteten 
Peptide verabreicht, wird das korpereigene Immunsystem spezifisch 
angelockt und aktiviert. 

Die Einhaltung der einzelnen Schritte ist hierbei nicht zwingend, sondern 
kann durch weitere Schritte erganzt bzw. ersetzt werden. 

Die jeweiligen Prototypen eines immunologischen bzw. pharmakologischen 
Wirkstoffs werden nachfolgend weiterentwickelt und verbessert. 



- 45 - 

Die Weiterentwicklung eines Impfstoffes kann dahingehend erfolgen, indem 
mehrere antigene Genprodukte oder Teile davon in einem Wirkstoff 
kombiniert werden und/oder mit verschiedenen Tragern bzw. Zusatzstoffen 
verabreicht werden. Als Trager fungieren verschieden attenuierte bakterielle 
oder virale Organismen und als Zusatzstoff e Adjuvantien und/oder Cytokine. 

Zur Weiterentwicklung eines pharmakologischen Wirkstoffs wird eine als 
wirksam charakterisierte Leadstruktur chemisch weiter modifiziert, so date 
eine optimale Bindung und Inhibierung des identifizierten Genprodukts 
erfolgt. Weiterhin sollte der Wirkstoff vom Patienten gut vertragen werden 
und geringe Nebenwirkungen besitzen. 

Zur Identifizierung von Wirkstoffen, die an Polynukleotide binden, kann ein 
Polynukleotid der Erfindung z.B. an eine Tragermatrix vorgekoppelt werden 
bzw. umgekehrt, die Wirkstoffe der Polypeptide- bzw. kombinatorischen 
Substanzenbank. Das verwendete darauffolgende Schema ist das gleiche 
wie das, das fur die Polypeptide schon beschrieben wurde. 

Solche inhibitorischen Substanzen konnen Polypeptide, Peptide, aber auch 
chemische Substanzen sein, wie etwa Antibiotika. Die inhibitorische 
Wirkung kann dabei in verschieden Stadien der Replikation der zu 
bekampfenden Mikroorganismen eingreifen. Beispiele sind 
Expressionsinhibitoren oder Enzyminhibitoren oder sonstige Inhibitoren, 
welche die naturliche Funktion der Polypeptide von Helicobacter und 
verwandten Mikroorganismen beeinflussen konnen. Solche inhibitorischen 
Substanzen sind ebenfalls Gegenstand der Erfindung. 

Eine weitere Moglichkeit, einen optimalen Wirkstoff gegen Helicobacter und 
andere bakterielle Infektionen zu finden, ist mit Hilfe von speziellen 
Computerprogrammen. Aufgrund von kristallographischen Daten, die von 
den in der Erfindung beschriebenen Polypeptiden gewonnen wurden kann 
ein Modell erstellt werden, das sterische, elektronische, hydrophobe und 
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sogenannten "resultierende Bindungsmomente" (RBMs) miteinander 
verbindet (Ray et al., 1998). Anhand dieses Modells konnen im weiteren 
Substanzen am Computer modelliert werden, die zwar die bereits 
identifizierten Leadstrukturen enthalten konnen, aber mit besseren 
Bindungseigenschaften ausgestattet sind. Es konnen jedoch auch vollig 
neuartige Wirkstoffe entworfen werden. 

Ein weiterer Aspekt der vorliegenden Erfindung ist eine Nukleinsaure, die fur 
ein essentielles sekretorisches Gen aus Helicobacter pylori kodiert, das 
durch das oben beschriebene erfindungsgemaSe Verfahren identifiziert 
wurde. Es wurden essentielle He/icobactergene mit dem vorliegenden 
Verfahren identifiziert, deren Nukleinsauresequenzen in den SEQ ID NO. 1 
bis 113 (ungerade Zahlen) angegeben sind. Eine erfindungsgema&e 
Nukleinsaure ist beispielsweise dadurch gekennzeichnet, da& sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl von 1 
bis 1 13 einschlieSlich ist, dargestellten Nukleinsauresequenzen oder 
einen proteinkodierenden Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz umfaBt. 

Neben den im Sequenzprotokoll gezeigten erfindungsgema&en 
Nukleotidsequenzen und diesen Sequenzen im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenzen umfaBt die 
vorliegende Erfindung auch Nukleotidsequenzen, die mit einer der zuvor 
genannten Sequenzen hybridisieren. Der Begriff "Hybridisierung" gemaS 
vorliegender Erfindung wird bei Sambrook et al. (Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor Laboratory Press (1989), 1.101- 
1.104) verwendet. Vorzugsweise spricht man von einer stringenten 
Hybridisierung, wenn nach dem Waschen fur eine Stunde mit 1 X SSC und 
0,1% SDS bei 50°C, vorzugsweise bie 55 °C, besonders bevorzugt bei 
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62°C und am meisten bevorzugt bei 68 C, insbesondere fur 1 h in 0,2 X 
SSC und 0,1 % SDS bei 55°C, vorzugsweise bei 55°C, besonders 
bevorzugt bei 62°C und am meisten bevorzugt bei 68°C noch ein positives 
Hybridisierungssignal beobachtet wird. Eine unter derartigen 
Waschbedingungen mit einer oder mehreren der erfindungsgemafcen 
Nukleotidsequenzen oder einer diesen Sequenzen im Rahmen der 
Degeneration des genetischen Codes entsprechenden Nukleotidsequenz 
hybridisierende Nukleotidsequenz ist eine erfindungsgemaRe Nukleotidse- 
quenz. 

Vorzugsweise ist die erfindungsgemalSe Nukleotidsequenz eine DNA. Sie 
kann jedoch auch eine RNA oder ein Nukleinsaureanalogon, wie etwa eine 
peptidische Nukleinsaure, umfassen, Besonders bevorzugt umfafct die 
erfindungsgemafce Nukleinsaure einen Protein-kodierenden Abschnitt der in 
Sequenzprotokoll dargestellten Nukleotidsequenzen oder eine Sequenz, die 
eine Homologie von mehr als 80 %, vorzugsweise mehr als 90 % und 
besonders bevorzugt mehr als 95 % zu den dargestellten Nukleotidse- 
quenzen oder einen vorzugsweise mindestens 20 Nukleotide (nt) und 
besonders bevorzugt mindestens 50 nt langen Abschnitt davon aufweist. 

Die Homologie wird in Prozent identischer Positionen beim Vergleich zweier 
Nukleinsauren (bzw. Peptidketten) angegeben, wobei 100% Homologie die 
vollige Identitatder verglichenen Kettenmolekiile bedeutet (Herder: Lexikon 
der Biochemie und Molekularbiologie, Spektrum Akademischer Verlag 
1995). 

Eine erf indungsgemafce Nukleinsaure kann fur ein sekretiertes Polypeptid mit 
Signalpeptid kodieren oder fur ein sekretiertes Polypeptid ohne Signalpeptid. 

Eine erfindungsgemaBe Nukleinsaure umfa&t sowohl die Sequenz des 
kodierenden Strangs als auch die dazu komplementare Sequenz. Letztere 
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kann beispielsweise bei der Herstellung von Antisense-Nukleinsauren 
Anwendung finden. 

Ebenfalls Gegenstand der Erfindung ist naturlich auch eine Genbank, die 
mindestens 2, bevorzugt mindestens 20, starker bevorzugt mindestens 1 00 
der genannten Nukleinsauren in Vektoren kloniert enthalt, 

Eine Auflistung der hierin und im Sequenzprotokoll angegebenen 
erfindungsgemaSen Nukleinsauren samt ihrer Genprodukte und deren 
Funktionen und putativen Funktionen ist in den Tabellen I und II angegeben. 

Bei den Genen, die im Sequenzprotokoll in ihrer Nukleinsaure- und 
Aminosauresequenz angegeben sind, handelt es sich um bakterielle Gene, 
Prokaryoten verwenden auBer dem AUG-Codon (mRNA) auch noch andere 
(alternative) Start-Codons. Diese sind AUU (codiert normalerweise fur 
Isoleucin, lie), UUG (codiert normalerweise fur Leucin, Leu) und GUG 
(kodiert normalerweise fur Valin, Val). Im Sequenzprotokoll wurden die 
Aminosauresequenzen gemaS dem normalerweise verwendeten 
Translationscode translatiert. Es wird darauf hingewiesen, daS beim Lesen 
des Sequenzprotokolls die prokaryontische Verwendung alternativer 
Startcodons berucksichtigt werden muS, und daS somit hierin auch von den 
Nukleinsauresequenzen gemaS SEQ ID NO. 35, 49, 61, 69, 75, 81, 103 
und 105 kodierte Aminosauresequenzen offenbart sind, welche anstatt mit 
einem im Sequenzprotokoll dargestellten jeweiligen Leu-, Val- oder lie-Rest, 
mit einem Methioninrest (Met) anfangen. 



Tabelle 
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I: Obligat essentielle G n 



SEQ ID 
NO 


VJ d 1 

(obligat 
essentiell 

« w O CI 1 LI w 1 1 


La 11 y 6 


iviogiicne cigenscnarten der 
Genprodukte 


Signal- 
peptid 


1 + 2 


HPS001 


873bp 


Signalpeptidase I 


+ 


3 + 4 


HPC003 


267bp 


Protein der Flagellenbiosynthese 


- 


C j_ e 

O T W 


nrLUUO 


"7 1 A U n 

/I4bp 


Lipoprotein 


+ 


7 + 8 


HPC029 


552bp 


Sekretiertes Protein 




9 + 10 


HPS042 


858bp 


Inneres Membranprotein, Ubiquinol- 
Oxidoreduktase 


- 




n i \* l OO/ 


i yzbp 


Sekretiertes Protein 


+ 


13 + 14 


(HPS1 71 ) 


/ Dp 


VAl/PAf lAf^Aft D<^A+/\!n 

oeKrenenes rTOtein 




15+16 


HPS065 

III vJvU O 

(HPS1 53) 




uipopro iein 


+ 


17 + 18 


HPS066 


1377bp 


1 n nPfP 1 ? f^A & m hvr^ nnrntoin Plcan. 
iiiiicicd ivici i iui di ipi u loll i 7 CIScll 

Schwefel-Bindungsprotein 




19 + 20 


HPS068 


1 533bD 

i w \j k/ yj 


1 inase 


i 

T 


21+22 


HPS074 


957bp 


Sekretiertes Prnt#»in 

vdlvl ICO 1 I UlCil 1 




23 + 24 


HPS083 


480bp 


Sekretiertes / nerinlj*Qm»ticr i h»c Prrk+oln 




25 + 26 


HPS084 


1983bp 


Sekretiertes / periplasmatisches Protein 


+ 


27 + 28 


HPC085 


372bp 


ocm clici itjb / penpiasmaxiscnes rTOtein 


+ 


29 + 30 


HPC090 


558bn 

\j \j \j u yj 


ocMcuci lco / per ifjidoi Tiaiiscnes protein 


i 

T 


31 +32 


HPS104 


768bo 


ii iicyi aico ivicrnDranproxein 




33 + 34 


HPS1 1 5 




r\ i rase Tur ixaxionenxransporr 




' 35+36 


HPS1 20 


2751 hn 


/-vuioeres iviernDranproTein, proteKtives 
Oberflachenantigen 




37 + 38 


HPS1 30 


990hn 

*J w \J VJ yJ 


^^Ifr f*ti prtoc Prntoin 

ucMcuci icb rroiein 


+ 


39 + 40 


HPS1 33 


1 TU £+UyJ 


iviui on i vui idu i er~r ro tei n 




41 +42 


HPC134 


600bo 


•niicieb ivi e i ii u ran protein, rTOiein- 
"Tra n s 1 o k atio n s n rr»t *»? n 




43 + 44 


HPS 143 


1536bp 


Sekretiertes / periplasmatisches Protein 




45 + 46 


HPS 144 


540bp 


Peptidoglykan-assoziiertes Lipoprotein 


+ 


49 + 50 


HPS152 


1062bp 


Sekretiertes / periplasmatisches Protein 


+ 


51+52 


HPS155 


2202bp 


Protein der Flagellenbiosynthese 




53 + 54 


HPC157 
(HPC181) 


189bp 


Sekretiertes Protein 




55 + 56 


HPS 183 


1008bp 


Eisen(lll) ABC-Transporter 




57 + 58 


HPS186 


240bp 


Sekretiertes Protein 




59 + 60 


HPS188 


1764bp 


Aufceres Membranprotein 


+ 


61+62 


HPS 190 


1443bp 


Sekretiertes / periplasmatisches Protein 
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Tabelle II: Fakultativ essentiell Gene 



SEQ ID 
NO 


Gen 
(fakultativ 
essentiell) 


Lange 


Mogliche Eigenschaften der 
Genprodukte 


Signa 
peptid 


99 + 100 


HPS004 
{HPS027, 
HPS1 21, 
HPS131) 


1 644bp 


Inneres Membranprotein * 


+ 


63 + 64 


HPC008 
(HPC1 14, 
HPC145) 


543bp 


Sekretiertes / peripiasmatisches Protein 


- 


65 + 66 


HPS013 


1 746bp 


2', 3'-zykIische Nukleotid-2'- 
Phosphodiesterase 


+ 


67 + 68 


HPS024 
(HPS025) 


1698bp 


Chemotaxis-Protein 


+ 


oy+ /o 


HPS036 


855bp 


Sekretiertes Protein 


+ 


"7 *1 _i_ 70 
/ 1 + /Z 


HPSOoo 


669bp 


Sekretiertes Protein 


- 


7^ _l "7>l 


HPS039 

/UDC1 A7\ 


804bp 


Sekretiertes Protein 


* 


/ O i / o 


LI DCA/I f\ 


1 o4bup 


: : 

Sekretiertes Protein 


+ 


77 -I- 7ft 


HroU4o 


y i ^op 


Sekretiertes Protein 


+ 


79 + 80 


HPS050 


834bp 


Peripiasmatisches Glutamin-Bindeprotein 


+ 


81+82 


HPS052 


1296bp 


AuSeres Membranprotein 




oO -r O** 


HroOOD 


1 1 97bp 


Sekretiertes Protein 


- 


OO + OO 


HPS059 


1 131bp 


ntegrales Membranprotein 


+ 


87 + 88 


HPS063 


516bp 


ATP Synthase F0, Untereinheit b 


+ 


89 + 90 


HPS069 


990bp 


Sekretiertes Protein 


+ 


91 +92 


HPS091 


684bp 


ntegrales Membranprotein 




93 + 94 


HPS095 


729bp 


AuBeres Membranprotein 


+ 


95 + 96 


HPS099 


975bp 


Sekretiertes Protein 


- 


97 + 98 


HPS1 17 
{HPS1 18, 
HPS162) 


1290bp 


Sekretiertes Protein 


+ 


IV i + 102 


HPS1 32 


3063bp 


Kationenefflux Protein 


+ 


47 + 48 


upp i ah 

nru i *T\j 

(HPC150, 
HPC179) 


i oo / up 


AipA Aanasin 


+ 


103 + 104 


HPS149 


2028bp 


Methylakzeptierendes 
Chemotaxisprotein 




105+106 


HPS161 


273bp 


Sekretiertes Protein 


+ 


107 + 108 


HPS176 


759bp 


Protein der cag Pathogenitatsinsel 




109 + 110 


HPS187 


1245bp 


Zinkabhangige Metalloprotease 


+ 


111 + 112 


HPS189 


1566bp 


Sekretiertes Protein 




113 + 114 


HPS191 


1782bp , 


Sekretiertes Protein 


+ 
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Ein weiterer Aspekt der vorliegenden Erfindung ist ein Vektor, der eine 
erfindungsgema&e Nukleinsaure oder einen Abschnitt davon enthalt. Die 
Nukleinsaure oder der Nukleinsaureabschnitt kann so in den Vektor kloniert 
sein, dafc sie entweder in Sense- oder Antisense Richtung exprimiert werden 
kann. Der Nukleinsaureabschnitt hat bevorzugt eine Mindestlange von 15 
Nukleotiden, starker bevorzugt 20 Nukleotiden, starker bevorzugt 50 
Nukleotiden. Dieser Vektor kann ein beliebiger prokaryontischer oder 
eukaryontischer Vektor sein, auf dem sich die erfindungsgemaSe DNA- 
Sequenz vorzugsweise in Verbindung mit Expressionssignalen befindet, wie 
z.B. Promoter, Operator, Enhancer etc. Beispiele fur prokaryontische 
Vektoren sind chromosomale Vektoren, wie etwa Bakteriophagen (z.B. 
Bakteriophage A) und extrachromosomale Vektoren wie etwa Plasmide, 
wobei zirkulare Vektoren besonders bevorzugt sind. Geeignete 
prokaryontische Vektoren sind z.B. bei Sambrook et aL, Molecular Cloning 
(1987), Kapitel 1-4, beschrieben. Andererseits kann der erfindungsgemafce 
Vektor auch ein eukaryontischer Vektor sein, z.B. ein Hefevektor oder ein 
fur hohere Zellen geeigneter Vektor (z.B. ein Plasmidvektor, viraler Vektor, 
Pflanzenvektor) . Derartige Vektoren sind beispielsweise bei Sambrook et al., 
supra, Kapitel 16 beschrieben. CAI- und SRM-Vektoren, wie oben 
beschrieben, sind ebenfalls Gegenstand der Erfindung. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Zelle, die mit 
einem erfindungsgema&en Vektor oder einer erfindungsgemaBen 
Nukleinsaure transformiert ist. In einer bevorzugten Ausfuhrungsform ist 
diese Zelle eine prokaryontische Zelle, vorzugsweise ein gram-negatives 
Bakterium, z.B. E.colL Andererseits kann dieerfindungsgema&e Zelle jedoch 
auch eine eukaryontische Zelle sein, wie etwa eine Pilzzelle, eine Hefezelle, 
eine tierische oder eine pflanzliche Zelle. Besonders bevorzugt handelt es 
sich bei der Zelle um einen Mikroorganismus, z.B. Helicobacter oder 
Salmonellen. Mit CAI- oder SRM-Vektoren transformierte Mikroorganismen 
sind oben bereits beschrieben worden. Diese sind, wie auch mit den obigen 
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Verfahren herstellbare Mutantenbanken, ebenfalls Gegenstand der 
Erfindung. 

Ein weiterer Aspekt der Erfindung betrifft ein essentielles und bevorzugt 
sekretiertes Polypeptid von H. pylori. Insbesondere ist dies ein Polypeptid, 
das 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl von 2 bis 
114 einschliefclich ist, dargestellten Aminosauresequenzen oder 

(b) eine mit einer der Sequenzen gemafc (a) immunologisch 
kreuzreagierende Sequenz umfafct. 

Unter immunologische kreuzreagierenden Sequenzen sind somit auch 
Muteine, Varianten und Fragmente der in den SEQ ID NO. 2 bis 114 
dargestellten Sequenzen umf a&t. Darunter sind Sequenzen zu verstehen, die 
sich durch Substitution, Deletion und/oder Insertion einzelner Aminosauren 
oder kurzer Aminosaureabschnitte von den obigen Sequenzen 
unterscheiden. 

Aufgrund von Homologieanalysen mit Hilfe des FASTA Proteinprogramms 
konnten den identifizierten Polypeptides deren Sequenz mit der 
Nukleinsauresequenz gefunden werden konnte, bestimmte Merkmale bzw. 
eine mutmaBHche Lokalisation im Bakterium zugewiesen werden. Einige der 
von den erfindungsgemalSen Nukleinsauren kodierten Polypeptide besitzen 
ein Signalpeptid und werden durch den Sec-abhangigen Transport- 
mechanismus an ihre Zielstelle exportiert, wahrend andere kein Signalpeptid 
besitzen und daher wahrscheinlich fiber einen Sec-unabhangigen 
Transportmechanismus, z.B. durch das ABC-Transporter-System, sekretiert 
werden (siehe Tabellen I und II). 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung der 
erfindungsgemaSen Polypeptide und -fragmente. Die Herstellung von 
erfindungsgemafcen Polypeptiden erfolgt vorzugsweise dadurch, daS man 
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eine Zelle mit einem erfindungsgemaSen DNA-Molekul oder Vektor 
transformiert, die transformierte Zelle unter Bedingungen kultiviert, bei 
denen eine Expression des Polypeptids stattfindet, und das Polypeptid aus 
der Zelle oder/und aus dem Kulturuberstand isoliert. Dabei kann das 
erfindungsgemaBe Polypeptid sowohl als Fusionspolypeptid als auch als 
Nichtfusionspolypeptid gewonnen werden. 

Das erfindungsgemaSe Polypeptid kann als Immunogen zur Herstellung von 
Antikorpern verwendet werden. 

Die vorliegende Erfindung betrifft somit auch einen Antikorper, der gegen 
ein erfindungsgemaBes Polypeptid gerichtet ist. Ebenfalls Gegenstand der 
Erfindung sind Fragmente solcher Antikorper, wie z.B. Fab-Fragmente oder 
Fc-Fragmente. 

Noch ein weiterer Aspekt der Erfindung ist ein Inhibitor der 
erfindungsgema&en Polypeptide, deren Fragmente, bzw. deren Expression, 
Presentation oder/und naturlichen Funktion. Dies ist bevorzugt ein Molekul, 
welches in der Lage ist, spezifisch an ein Polypeptid oder Fragment davon 
zu binden oder/und dessen Expression, Presentation oder/und naturliche 
Funktion zu beeinflussen. Die Identifizierung von solchen spezifischen 
Bindepartnern wurde oben bereits beschrieben. Besonders geeignet als 
Inhibitoren sind Proteine oder Peptide, die ein erfindungsgema&es Polypeptid 
in seinen naturlichen Funktion hemmen, z.B. konnen Enzyme durch 
Blockieren des aktiven Zentrums gehemmt werden. 

Noch ein weiterer Aspekt der vorliegenden Erfindung betrifft eine 
pharmazeutische Zusammensetzung, die als Wirkstoff ein 
erfindungsgemaBes DNA-Molekul, einen erfindungsgemaRen Vektor, eine 
erfindungsgemaBe Zelle, ein erfindungsgema&es Polypeptid, einen 
erfindungsgemaSen Antikorper oder Fragment davon oder/und ein 
inhibitorisches Molekul, das in der Lage ist, spezifisch an ein 
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erfindungsgemalSes Polypeptid zu binden, gegebenenfallszusammen mitub- 
lichen pharmazeutischen Hilfs-, Verdunnungs-, Zusatz- und Tragermitteln 
enthalt. 

Eine erfindungsgemaSe pharmazeutische Zusammensetzung kann auf ver- 
schiedene Art und Weise und unter Verwendung einzelner ihrer Bestandteile 
als wirksame Substanzen zur Hemmung der Reproduktion von Helicobacter 
Organismen in einem Wirt, speziell im Menschen verwendet werden. 

Die erfindungsgemafce pharmazeutische Zusammensetzung kann einerseits 
zur Diagnostik einer He/icobacter-\nfekt\on verwendet werden. Die 
Diagnostik auf Nukleinsaureebene erfolgt vorzugsweise durch Verwendung 
von Hybridisierungssonden, bzw. Primern, welche eine spezifische DNA- 
Sequenz aufweisen, die zu mindestens einen Abschnitt einer der in SEQ ID 
NO. 1 bis 1 1 3 (ungerade Zahlen) dargestellten Sequenzen komplementar ist, 
so dalS sie eine Amplifikation der erfindungsgemaSen Sequenzen erlauben. 
Wir bereits erwahnt, konnen diese Amplifikationsprimer oder Sonden auch 
zur Amplifikation und damit zur Detektion von verwandten Mikroorganismen 
verwendet werden, wenn diese Gensequenzen aufweisen, die fur dasselbe 
essentielle Gen kodieren. Auf Proteinebene erfolgt die Diagnostik 
vorzugsweise mit Hilfe der erfindungsgemafcen Antikorper. 

Des weiteren ist die pharmazeutische Zusammensetzung zur Prophylaxe und 
Bekampfung von A/e//co/?acfer-lnfektionen und Infektionen mit verwandten 
Mikroorganismen geeignet. 

Ein weiterer wichtiger Aspekt der vorliegenden Erfindung ist die 
Verwendung der identifizierten essentiellen Gene von Helicobacter pylori zur 
Prevention oder Bekampfung einer Infektion mit Helicobacter oder 
verwandten Mikroorganismen. Insbesondere konnen diese identifizierten 
essentiellen Gene zur Herstellung von Impfstoffen (Vakzinen) verwendet 
werden (siehe oben). 
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Eine weitere Verwendung der Polypeptide der Erfindung besteht in der 
Aufreinigung der Antikorper gegen H. pylori Polypeptide und gegen 
entsprechende Polypeptide aus verwandten und anderen Mikroorganismen. 

Die Erfindung wird durch die nachfolgenden Beispiele, Abbildungen und das 
Sequenzprotokoll naher erlautert. Im Sequenzprotokoll sind die folgenden 
Nukleinsaure- und Aminosauresequenzen dargestellt. 

Abbildung 1 zeigt eine schematische Darstellung eines CAI-Vektors. 

Abbildung 2 zeigt eine schematische Darstellung eines Verfahrens der 
konditionalen Antisense-Hemmung (CAI). 

Abbildung 3 zeigt eine schematische Darstellung der Untersuchung der 
Lebendfahigkeit von defizienten Mikroorganismen anhand ihrer 
Uberlebensraten mit Hilfe des CIA-Verfahrens. 

Abbildung 4 zeigt eine schematische Darstellung des subtraktiven CAI- 
Verfahrens (CAI). 

Abbildung 5 zeigt eine schematische Darstellung eines SRM-Vektors. 

Abbildung 6 zeigt eine schematische Darstellung der reversiblen 
Inaktivierung eines Gens durch die Insertion/Excision eines 
konditional replizierenden SRM-Plasmids. 

Abbildung 7 zeigt eine schematische Darstellung eines SRM-Verfahrens. 



Abbildung 8 zeigt eine schematische Darstellung der Anreicherung von 
Fragmenten essentieller Gene durch subtraktive Hybridisierung. 



Beispiel 
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Die Anwendung des dargestellten Gesamtverfahrens ist exemplarisch am 
Beispiel des Pathogens Helicobacter dargestellt, laBt jedoch auch mit 
anderen pathogenen Keimen durchfuhren. 

1. Identifizierung essentieller Gene pathogener Mikroorganismen 

Schritt 1 

Anreicherung von H. pylori Genen kodierend fur sekretorische/exkretorische 
Polypeptide 

Herstellunq einer H. pylori Genbank im Minimalvektor pMin2: Als 
Ausgangsstamm dient der H. pylori Wildtyp Stamm 69A. Die Bakterien 
werden auf Serumplatten oder einem anderen adaquaten Medium 
(Westblom et a!., 1991) bei einer Temperatur von 37°C in einer 
Atmosphare von 5% 0 2 , 1 0% C0 2/ 85% N 2 angezuchtet. Die Isolierung der 
chromosomalen DNA erfolgt nach der Methode von Leying et al., (1992), 
wobei die DNA anschlielSend uber einen Casium-Chlorid-Gradienten 
aufgereinigt wird. 50/vg der gereinigten, chromosomalen DNA wird mit den 
Restriktionsendonukleasen Sau3A und HpaW partiell gespalten, die DNA 
Fragmente in einem Agarosegel aufgetrennt und die Fragmente in einer 
GroSe von 3 bis 6 kbp aus dem Gel mit Hilfe des Geneclean II Kits (Bio101) 
eluiert. Die isolierten DNA-Fragmente werden in den Bg/W und C/al 
geschnittenen pMin2-Vektor (Kahrs et al., 1995) kloniert und uber 
Elektroporation in den £.co//-Stamm E181 transformiert, dem zuvor das 
Plasmid pTnMsx9 ubertragen wurde. Insgesamt werden uber einen solchen 
Ansatz ca. 4000 Klone generiert. Der £.co//-Stamm El 81 ist ein Derivat des 
Stammes HB101 (Boyer und Roulland-Dussoix, 1969) und enthalt den 
lysogenen-Phagen CH616 zur Replikation des pTnMax9-Plasmids. 
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Serumplattenrezeptur: 

36 g GC-Agar (Basis) in 910 ml Aqua dest. suspendieren und autoklavieren 
auf ca. 45 °C abkuhlen lassen 
Zugabe von 10 ml Vitaminmix 

Zugabe von jeweils 1 ml der Antibiotikastammldsung: 

Vancomycin (10 mg/l in Aqua bidest) 

Nystatin (0,793 mg/l in DMF*) 

Trimethoprim (5 mg/l in DMF*) 

Amphotericin (5 mg/l in DMF*) 
* DMF = Dimethylformamid 
Zugabe von 90 ml Serum oder 
Zugabe von 8% Pferdeblut = 80 ml 
oder gleiche Menge Humanblut 

Antibiotika Stammlosunq 

Vancomycin 100 mg in 10 ml Aqua bidest 

Nystatin 7,93 mg in 10 ml DMF (je 1 ml pro Liter GC-Agar 



zusetzen) 



Trimethoprim 
Amphotericin 
(Lagerung im 



50 mg in 10 ml DMF 
50 mg in 10 ml DMF 
Kuhlschrank bis max. 8 Wochen) 



Vitaminmix (Konzentrat) 



Dextrose (D-Glucose) 100 g 

L-Glutamin 10 g 

Cystein HCI (C 3 H 7 N0 2 S x HCI x H 2 0) 26 g 



Cocarboxylase 100 mg 



in 50 ml 



Fe (N0 3 ) 3 20 mg 

Thiamin HCI 3 mg 



Aquabidest. losen 



DPN NAD 250 mg 



Vitamin B 12 10 mg 

L-Cystein (C 6 H 12 N 2 0 4 S 2 ) 1,1 g 
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Adenin 



Guanin CI 



1,0 g in 15 ml HCI 

30 mg (32%ig) losen 



L-Arginin HCI 
p-Aminobenzoesaure 



Uracil 



500 mg 
1 50 mg 
13 mg 



(sterilfiltrieren, in 10 ml Portionen abfullen und einfrieren) 

Genetische Anreicherung sekretorischer/exkretorischer H. pylori 
Genprodukte: Das auf pTnMax9 liegende Transposon JnMax9 ist mit dem 
genetischen Marker fc-Lactamase ausgestattet. Dieser Marker ist auf dem 
Transposon so angelegt, date damit die Selektion erfolgreicher Transposon- 
Insertionen ermoglicht wird, wenn dieses im korrekten Leserahmen solcher 
Gene vorliegt, deren Produkte von £.co//-Stamm E145 rif sekretiert bzw. 
exportiert werden. Die Insertion des Transposons in ein solches Gen fuhrt 
zu einer Genfusion zwischen dem Zielgen und dem Marker, wobei durch ein 
im Zielgen determiniertes Sekretions- und/oder Exportsignal das 
Fusionsprotein aus der Zelle geschleust wird und die Aktiyitat des integralen 
Reportergens entfaltet wird. Im Fall der ^-Lactamase konnen die Klone 
direkt uber die Entwicklung einer Resistenz gegen Ampicillin nachgewiesen 
werden. Das TnMax9 Transposon auf pTnMax9 wird uber IPTG aktiviert. 

Die Transposon-Mutagenese der Genbank wird in Pools von bis zu 20 
Einzelklonen durchgefuhrt. Die jeweiligen Pools weren auf LB-Platten 
ausplattiert, die mit 100>l/M IPTG, 15//g/ml Chloramphenicol und 15//g/ml 
Tetrazyklin versetzt sind. In einem zweiten Schritt werden die TnMax9 
mutagenisierten pMin2-Plasmide uber Konjugation in den E.coli Stamm 
E145 rif uberfuhrt, da diese mit einem entsprechenden mob-Signal (or/T) 
ausgestattet sind. Die pTnMax9-Plasmide werden dagegen nicht ubertragen. 
Folglich kommt es in E. coli E1 45 rif zu einer spezifischen Vervielfaltigung der 
mutagenisierten pMin2 Genbank. Die entsprechenden Transkonjuganten 
werden auf LB-Medium mit 1 5 //g/ml Chloramphenicol, 1 5 //g/ml Tetrazyklin 
und 100/yg/mI Rifampicin selektioniert. Insgesamt werden 500 bis 1000 
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Transkonjuganten in 2 ml LB-Medium zusammengefaGt und in 
entsprechenden Verdunnungen (10 1 bis 10' 2 ) auf LB-Platten angeziichtet, 
die mit 50 jjg/m\ Ampicillin versetzt sind. Nach einer Kultivierung der Platten 
iiber 36 Stunden bei 37 °C erhalt man im gesamten Ansatz 200 bis 300 
Ampicillin-resistente Klone mit Transposon inserierten Plasmiden. 

Schritt 2 

Herstellung Gen-defizienter H. pylori, die in sekretorische/exkretorische 
Polypeptide kodierende Gene mutiert sind und die Identifizierung solcher 
Gene mit essentieller biologischer Funktion. 

Herstellung Gen-defizienter H. pylori Mutanten: Durch Einbringung der 
gewonnenen Plasmide mit den TnMax9-mutierten H. pylori Genen, kodierend 
fur sekretierte/exkretierte Polypepti de in einen H. pylori Wildtyp Stamm 
konnen Gen-spezifische Mutanten erzeugt werden. Bedingt durch die 
klonierten H. pylori Gensequenzen auf den Plasmiden kommt es im Falle 
eines doppelten homologen Rekombinationsereignisses zu der genomischen 
Insertion des TnMax9-Transposons in das chromosomale Zielgen und damit 
zu dessen Inaktivierung. Durch den genetischen Marker auf dem Transposon 
kann dieser Vorgang selektioniert werden, da das pMin2 Plasmid in H. pylori 
nicht repliziert wird. 

In der Durchfuhrung wird der H. pylori Wildtyp Stamm 69A in Einzelansatzen 
mit den gewonnenen individuellen Plasmiden transformiert, wobei die 
naturliche Kompetenzdes Bakteriums, DNAaufzunehmen, ausgenutzt wird. 
Entsprechend den Standard Kultivierungsbedingungen werden die Bakterien 
in BHI-Medium aufgenommen und bis zu einer optischen Dichte bei 550 nm 
von 0,1 bei 37 °C unter mikoraerophilen Bedingungen angeziichtet. Die 
einzelnen Kulturansatze werden jeweils mit 200 bis 599 ng gereinigte 
Plasmid-DNA versetzt und die Kultur uber Nacht fortgesetzt. 



- 60 - 

Charakterisierung cler biologischen Funktion der Gen-defizienten H. pylori 
Mutanten im Wachstumstest: Die einzelnen Ansatze werden nach der 
Kultivierung auf Serumplatten ausplattiert, welche mit 4 //g/ml 
Chloramphenicolversetztsind.HinsichtlichderWachsumseigenschaftender 
einzelnen Mutanten im Vergleich zum Wildtyp Stamm konnen 3 Kategorien 
unterschieden werden: (1) Mutanten, die nicht wachsen; (2) Mutanten, die 
kleinere Kolonien ausbilden; (3) Mutanten, die eine normale Koloniegrofce 
entwickeln. Diese Ergebnisse konnen fur jedes Ausgangsplasmid 
reproduzierbar erzielt werden. Zur eindeutigen Beurteilung der biologischen 
Bedeutung der Gen-defizienten Mutanten der Kategorie 1 werden diese dem 
CAI-Verfahren zugefuhrt. Die Gen-defizienten Mutanten der Kategorie 2 und 
3 werden in den anderen biologischen Testsystemen analysiert. 

Schritt 3 

Ermittlung der Identitat der H. pylori Gene kodierend fur 
sekretorische/exportierte Polypeptide. 

Zur Ermittlung der Primarstruktur der identifizierten H. pylori Gene, werden 
die jeweiligen Ausgangsplasmide aus dem E.cofi Stamm verwendet. Die 
Plasmide werden aus diesen Stammen isoliert und die Nukleotidsequenz der 
Zielgene durch Sequenzierung der Bereiche oberhalb und unterhalb der 
Insertionsstelle des Transposons im Zielgen bestimmt. Das Leseraster des 
Zielgens kann direkt ermittelt werden, da das Transposon-kodierte B- 
Laktamase Gen eine aktive Fusion mit dem Genprodukt des Zielgens eingeht 
(s.o.) . Die Sequenzierung wird mit Hilfe eines ABI-Sequenz-Automaten nach 
Angaben des Herstellers mit folgenden Sequenzprimern durchgefuhrt: M1 3- 
F (GTAAAACGACGGCCAGT) und M13-RP1 (CAGGAAACAGCTATGACC) . 
Zur weiteren Charakerisierung der Gene wird die Datenbank Genebank des 
GCG-Programms herangezogen, z.B. zur Identifizierung bekannter, 
homologer Gene anderer Mikroorganismen (FASTA), zur Identifizierung 
potentieller Signalpeptidbereiche (SPSCAN) oder zur Identifizierung von 
Lipoproteinen (MOTIFS). 
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Bei einem Teil der charakterisierten Klone konnte nicht die vollstandige 
Gensequenz ermittelt werden, da das klonierte DNA-Fragment nicht das 
gesamte Gen enthielt. Das verfugbare DNA-Fragment wird dazu eingesetzt, 
um aus der Original-Genbank ein DNA-Fragment mit vollstandigen Gen zu 
isolieren. Aus diesen Klonen konnen dann mit einem Gen-spezifischen 
Primer und einem Vektor-spezifischen Primer die fehlenden Gensequenzen 
amplifiziert und anschlieSend direkt sequenziert werden. 
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Anspruch 

Verfahren zur Bereitstellung von Mitteln zum Nachweis, zur 
Prevention oder/und zur Therapie von mikrobiellen Infektionen, 
dadurch gekennzeichnet, 
da(5 es die Schritte umfaSt: 

(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendef izienter 
Mikroorganismen durch konditionale Antisense-Hemmung 
(CAI) oder/und subtraktive Rekombinations-Mutagenese (SRM) 
und Bestimmung der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen in einem Testsystem. 

(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung 
der Mikroorganismen oder verwendeter Mikroorganismen 
herbeifuhren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit 
als Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, 

daS obligat essentielle Gene durch CAI identifiziert werden. 

Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, 

da& fakultativ essentielle Gene durch SRM identifiziert werden. 
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Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS vor Schritt (A) eine Selektion auf Gene durchgefuhrt wird, die fur 
Polypeptide mit einer bestimmten Funktionalitat kodieren oder/und die 
fur Polypeptide kodieren, die in einer bestimmten Entwicklungsstufe 
exprimiert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die Selektion mit Hilf e von Hybridisierungsverfahren durchgefuhrt 
wird, ausgewahlt aus Subtraktions- und Array-Verfahren. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

daS die Selektion auf spezifische subtrahierte apathogene oder 
pathogene Gene durchgefuhrt wird. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

daB die Selektion auf spezifische subtrahierte Gene von H. pylori oder 
H.heilmannii durchgefuhrt wird. 

Verfahren nach einem der Anspruche 4 bis 7, 
dadurch gekennzeichnet, 

daB fur exportierte Polypeptide kodierende Gensequenzen selektiert 
werden. 

Verfahren nach einem der Anspruche 4 bis 8, 
dadurch gekennzeichnet, 

dafc fur sekretierte Polypeptide kodierende Gensequenzen selektiert 
werden. 
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10. Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

daB fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der vitalen Form aus der Uberdauerungsform notwendig 
5 sind. 

1 1 . Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

daS fur Polypeptide kodierende Gene selektiert werden, welche zur 
10 Entwicklung der Uberdauerungsform aus der vitalen Form notwendig 

sind. 

12. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

date in Schritt (A) zur Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen 
Testsysteme, ausgewahltaus//7-wYro-Systemen, Zellkultursystemen, 
Gewebekultursystemen und Tiermodellen als naturliche Umgebung 
verwendet werden. 



15 



20 



13. Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

da(5 diejenigen defizienten Gensequenzen, welche zu nicht 
kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
25 gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 

essentiellen Gene zugeordnet werden. 

14. Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

30 da& diejenigen defizienten Gensequenzen, welche zu kultivierbaren 

aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
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Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 
Gene zugeordnen werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

date die identifizierten Gene zur Herstellung von. Primern verwendet 
werden, mit Hilfe derer entsprechende Gene aus verwandten 
Mikroorganismen, Subspezies oder/und Arten identifiziert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

da& in Schritt (B) spezifische Wirkstoffe identifiziert werden, welche 
die Expression, Presentation oder/und Funktion der essentiellen 
Polypeptide beeinflussen, insbesondere immunologisch wirksame 
Substanzen, Bindepartner der Polypeptide oder deren Fragmente 
oder/und inhibitorische Substanzen. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS Schritt (B) eine Bestimmung des immunogenen Potentials der 
Polypeptide oder/und deren Fragmente umfalSt, wobei die 
identifzierten Gene exprimiert werden und anschlieBend eine 
Western-Blot-Analyse durchgefuhrt wird oder/und daS mit den 
identifzierten Polypeptiden oder Fragmenten davon eine Vakzinierung 
in Zellkultur oder im Tiermodell durchgefuhrt und die Auslosung einer 
spezifischen Immunreaktion beobachtet wird. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daR Schritt (B) eine Bestimmung des Bindungspotentials der 
Polypeptide oder deren Fragmente durch Screening von 



- 68 - 

Substanzenbibliotheken, Oberflachendisplay verfahren, kristallo- 
graphische Analyse oder/und Computer-Modelling umfaBt. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS die diagnostischen, praventiven oder/und therapeutischen Mittel 
in Form von passiven Impfstoffen oder aktiven Impfstoffen 
bereitgestellt werden. 

Verfahren nach Anspruch 1 9, 
dadurch gekennzeichnet, 

daft die passiven Impfstoffe in Form von Antikorpern oder/und 
Antikorperfragmenten und die aktiven Impfstoffe in Form von 
heterologen Tragersystemen oder/und in Form von Antigenen, 
Antigenfragmenten, Subunit-Vakzinen, Lebendvakzinen, DNA- 
Vakzinen oder/und Lebensmittelvakzinen bereitgestellt werden. 

Verfahren nach einem der vorhergehenden Anspruche 1 bis 19, 
dadurch gekennzeichnet, 

daB die diagnostischen, praventiven oder/und therapeutischen Mittel 
inhibitorische Substanzen umf assen, insbesondere Expressionsinhibi- 
toren oder/und Enzyminhibitoren. 

Verfahren zur Identifizierung essentieller mikrobieller Gene, 
dadurch gekennzeichnet, 
daB es die Schritte umfafct: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer 
mikrobiellen DNA-Sequenz, in der die gendefizienten 
Mikroorganismen defizient sind. 
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(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur 
die Uberlebensfahigkeit sind. 



23. Verfahren nach Anspruch 22, 
5 dadurch gekennzeichnet, 

daS die gendefizienten Mikroorganismen hergestellt werden, indem 
ein DNA-Abschnitt in einem mikrobiellen Genom mutagenisiert wird. 

24. Verfahren nach anspruch 22, 
10 dadurch gekennzeichnet, 

da&der DNA-Abschnitt durchTransposon-Mutagenese mutagenisiert 
wird. 

25. Verfahren nach Anspruch 23, 
15 dadurch gekennzeichnet, 

daB die Mutagenisierung des DNA-Abschnitts auf dem mikrobiellen 
Genom durch homologe Rekombination erfolgt. 

26. Verfahren nach Anspruch 25, 
20 dadurch gekennzeichnet, 

daS das SRM-Verfahren angewendet wird. 

27. Verfahren nach Anspruch 23, 
dadurch gekennzeichnet, 

25 daS die gendefizienten Mikroorganismen hergestellt werden, indem 

in Mikroorganismen ein DNA-Abschnitt oder eine Teilsequenz davon 
in Form von Antisense-RNA exprimiert wird. 

28. Verfahren nach Anspruch 27, 
30 dadurch gekennzeichnet, 

daB das CAI-Verfahren angewendet wird. 
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29. Verfahren nach einem der Anspruche 22 bis 28, 
dadurch gek nnzeichnet, 

daS zur Bestimmung der Lebens- oder/und Oberlebensfahigkeit der 
gendefizienten Mikroorganismen Testsysteme ausgewahlt aus In- 
5 wY/-o-Systemen, Zellkultursystemen, Gewebekultursystemen und 

Tiermodellen als naturliche Umgebung verwendet werden. 

30. Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

10 da& diejenigen defizienten Gensequenzen, welche zu nicht 

kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

15 31. Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

daS diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 
20 Gene zugeordnet werden. 

32. Verfahren nach einem der Anspruche 22 bis 31, 
dadurch gekennzeichnet, 

daSdas Identifizieren des proteinkodierenden DNA-Abschnitts durch 
25 Expression in einem Wirtsorganismus und Nachweis des 

Vorhandenseins eines Expressionsproduktes erfolgt. 

33. Verfahren nach einem der Anspruche 32 bis 32, 
dadurch gekennzeichnet, 

30 dalS es weiterhin umfaBt: 

(v) Herstellen von Primern zur Amplifikation und Detektion von 
homologen Gensequenzen in heterologen Mikroorganismen 



10 
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(vi) Identifizieren der homologen Gensequenzen. 

34. Nukleinsaure, kodierend fur ein essentielles sekretorisches Gen aus 
Helicobacter, identifiziert durch das Verfahren nach einem der 
Anspruche 22 bis 33. 

35. Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

dalS sie fur ein sekretiertes Polypeptid mit Signalpeptid kodiert. 

36. Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

daB sie fur ein sekretiertes Polypeptid ohne Signalpeptid kodiert. 



15 37. Nukleinsaure, 

dadurch gekennzeichnet, 

da£ sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl 
von 1 bis 113 einschlielSlich darstellt, dargestellten 

20 Nukleinsauresequenzen, Oder einen proteinkodierenden 

Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter 
25 stringenten Bedingungen hybridisierende Nukleotidsequenz 

umfaBt. 

38. Genbank, umfassend mindestens zwei Nukleinsauren nach einem der 
Anspruche 34 bis 37. 

30 
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39. Vektor, 

dadurch g kennzeichnet, 

da& er mindestens eine Nukleinsaure nach einem der Anspruche 34 
bis 37 oder einen Abschnitt davon enthalt. 

5 

40- Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
date er ein CAI-Vektor ist. 

10 41 . Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
dafc er ein SRM-Vektor ist. 

42. Zelle, 
is dadurch gekennzeichnet, 

date sie mit einer Nukleinsaure nach einem der Anspruche 34 bis 37 
oder einen Vektor nach einem der Anspruche 39 bis 41 transformiert 
ist. 

20 43. Mutantenbank, 

dadurch gekennzeichnet, 

da& sie aus mindestens zwei Mikroorganismen besteht, die mit einem 
Vektor nach Anspruch 40 oder einem Vektor nach Anspruch 41 
transformiert sind. 

25 

44. Polypeptid, 

dadurch gekennzeichnet, 

da& es von einer Nukleinsaure nach einem der Anspruche 34 bis 37 
kodiert ist. 



30 
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Polypeptid nach Anspruch 44, 
dadurch gekennzeichnet, 
dalS es 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl 
von 2 bis 114 einschliefSlich darstellt, dargestellten 
Arninosauresequenzen oder 

(b) eine mit einer der Sequenzen gemalS (a) immunologisch 
kreuzreagierende Sequenz umfalSt. 

Polypeptid nach Anspruch 45, 
dadurch gekennzeichnet, 

dalS es ein essentielles sekretiertes Polypeptid ist. 

Polypeptidfragment, 
dadurch gekennzeichnet, 

dalS es einen immunogenen Abschnitt einer der Sequenzen nach 
Anspruch 45 aufweist. 

Inhibitorisches Molekul, erhaltlich durch das Verfahren nach 
Anspruch 1 , 

dadurch gekennzeichnet, 

dalS es in der Lage ist, spezifisch an ein Polypeptid oder Fragment 
davon nach einem der Anspruche 44 bis 47 zu binden oder/und 
dessen Expression, Presentation oder/und naturliche Funktion zu 
beeinflussen. 

Verfahren zur Herstellung eines Polypeptids oder Polypeptidfragments 
nach einem der Anspruche 44 bis 47, 
dadurch gekennzeichnet, 

dalS man eine Zelle mit einer Nukleinsaure nach einem der Anspruche 
34 bis 37 oder einem Vektor nach Anspruch 39 transformiert, die 
transformierte Zelle unter Bedingungen kultiviert, bei denen eine 
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Expression des Polypeptids stattfindet und das Polypeptid aus der 
Zelle oder/und dem Kulturuberstand isoliert. 



50. Verwendung eines Polypeptids oder eines Fragmentes davon nach 
5 einem der Anspriiche 44 bis 47 davon als Immunogen zur Erzeugung 

von Antikorpern. 

51 . Antikorper oder Fragment davon, 
dadurch gekennzeichnet, 

io dafS er spezifisch ist fur ein Polypeptid oder ein Fragment davon nach 

einem der Anspriiche 44 bis 47. 

52. Pharmazeutische Zusammensetzung, 
dadurch gekennzeichnet, 

15 daS sie als Wirkstoff 

a) eine Nukleinsaure nach einem der Anspriiche 34 bis 37, 

b) einen Vektor nach Anspruch 39, 

c) eine Zelle nach Anspruch 42, 

d) ein Polypeptid oder ein Fragment davon nach einem der 
20 Anspruche 44 bis 47, 

e) einen Antikorper oder Fragment davon nach Anspruch 51 
und/oder 

f) ein inhibitorisches Molekiil nach Anspruch 48, 
gegebenenfalls zusammen mit ublichen pharmazeutischen Hilfs-, 

25 Verdiinnungs-, Zusatz- und Tragermitteln, enthalt. 

53. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Diagnostik, Prevention oder/und Therapie einer 
Helicoba c ter- 1 n f e ktio n . 

30 

54. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Hemmung der Reproduktion von Helicobacter- 
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Organismen und/oder anderen anthrogenen Mikroorganismen in 
einem Wirt. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daS eine Nukleinsaure nach einem der Anspruche 34 bis 37 als DNA- 
Vakzin formuliert wird. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daB ein Polypeptid oder Polypeptidfragment nach einem der 
Anspruche 44 bis 47 als Subunit-Vakzin oder als Lebendvakzin 
formuliert wird. 

Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Herstellung eines Mittels fur die Diagnostic 
Prevention oder/und Therapie einer //e//co6acfeA*-lnfektion. 
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Zusamm nfassung 

Die vorliegencle Erfindung betrifft Verfahren zur Bereitstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln gegen 
mikrobielle Infektion und zur Identifizierung und Charakterisierung 
essentieller Gene aus Helicobacter pylori. Weiterhin betrifft sie die 
identifizierten Nukleinsauren, welche fur die essentiellen Genprodukte 
kodieren, und die davon kodierten Polypeptide. 
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S EQUENZ PROTO KOLL 

(1) ALLGEMEINE ANGABEN: 

. ( i ) ANMELDER : 

(A) NAME: CREATOGEN Biosciences GmbH 

(B) STRASSE: Ulmer Strasse 160 a 

(C) ORT: Augsburg 

(E) LAND : DE 

(F) POSTLEITZAHL: 86156 

(A) NAME: Max-Planck-Gesellschaf t zur Foerderung der 

Wissenschaf ten e.V. 

(B) STRASSE: Hof gartenstrasse 2 

(C) ORT: Muenchen 

(E) LAND: DE 

(F) POSTLEITZAHL: 80539 

(ii) BEZEICHNUNG DER ERFINDUNG: Helicobacter-Proteine zur 
Identif izierung, 

Entwicklung und Optimierung von immunologischen und 
pharmakologischen Wirkstof fen 

(iii) ANZAHL DER SEQUENZEN: 114 

(iv) COMPUTER-LESBARE FASSUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patent In Release #1.0, Version #1.3 0 

(EPA) 

(2) ANGABEN ZU SEQ ID NO: 1: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 873 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 

(vii) UNMITTELBARE- HERKUNFT: 

(B) CLON(E) : HPS001 (HPS166) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..873 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

ATG AAA TTT TTA CGC HCT GTT TAT GCA TTT TGC TCC AGT TGG GTA GGG 4 8 

Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
1 5 10 15 



2 



ACG ATT GTT ATT GTG CTG TTG GTT ATC TTT TTT ATC GCG CAA GCC TTT 96 
Thr lie Val lie Val Leu Leu Val lie Phe Phe lie Ala Gin Ala Phe 
20 25 30 

ATC ATT CCC TCT CGC TCT ATG GTT GGC ACG CTC TAT GAG GGC GAC ATG 144 
lie lie Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

CTC TTT GTC AAA AAG TTT TCT TAC GGC ATA CCC ATT CCT AAA ATC CCA 192 
Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys He Pro 
50 55 60 

TGG ATT GAG CTT CCT GTT ATG CCT GAT TTT AAA AAT AAC GGA CAT TTG 240 
Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

ATA GAG GGG GAT CGC CCT AAG CGT GGC GAA GTG GTG GTG TTT ATC CCT 288 
He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 



ICC CAT GAA AAA AAG TCT TAC TAT GTT AAA AGG AAT TTT GCC ATT GGA 336 
o His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 



100 105 HO 



GGC GAT GAG GTG TTG TTC ACT AAT GAG GGT TTT TAT TTG CAC CCT TTT 384 
Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

GAG AGC GAC ACG GAC AAA AAT TAC ATC GCT AAA CAT TAC CCT AAC GCC 432 
Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

ATG ACA AAA GAA TTT ATG GGT AAA ATT TTT GTT TTA AAC CCT TAT AAA 480 
Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

AAT GAG CAT CCG GGT ATC CAT TAC CAA AAA GAC AAT GAA ACC TTC CAC 528 
Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

TTA ATG GAG CAA TTA GCC ACT CAA GGC GCA GAA GCT AAT ATC AGC ATG 576 
Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 



CTC ATT CAA ATG GAG GGC GAA AAG GTG TTT TAT AAG AAA ATC AAT 624 
in Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

GAC GAT GAA TTT TTC ATG ATC GGC GAC AAC AGA GAC AAT TCT AGC GAC 672 
Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 

TCG CGC TTT TGG GGG AGT GTG GCT TAT AAA AAC ATC GTG GGT TCG CCA 720 
Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn He Val Gly Ser Pro 
225 230 235 240 

TGG TTT GTT TAT TTC AGT TTG AGT TTA AAA AAT AGC CTA GAA ATG GAT 768 
Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 

GCA GAA AAT AAC CCT AAA AAA CGC TAT CTG GTG CGT TGG GAA CGC ATG 816 
Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 



260 



265 



270 



TTT AAA AGC GTT GGA GGC TTA GAA AAA ATC ATT AAA AAA GAA AAC GCA 
Phe Lys Ser Val Gly Gly Leu Glu Lys lie lie Lys Lys Glu Asn Ala 
275 280 285 

ACG CAT TAA 
Thr His * 
290 

(2) ANGABEN ZU SEQ ID NO : 2 : 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 291 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



» 



(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

[et Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
15 10 15 




Thr lie Val lie Val Leu Leu Val lie Phe Phe lie Ala Gin Ala Phe 
20 25 30 

lie lie Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

Leu Phe Val Lys Lys Phe Ser Tyr Gly lie Pro lie Pro Lys lie Pro 
50 55 60 

Trp lie Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

lie Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe lie Pro 
85 90 95 

Pro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala lie Gly 
100 105 110 

Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

lu Ser Asp Thr Asp Lys Asn Tyr lie Ala Lys His Tyr Pro Asn Ala 
130 135 140 

Met Thr Lys Glu Phe Met Gly Lys lie Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

Asn Glu His Pro Gly lie His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn lie Ser Met 
180 185 190 

Gin Leu lie Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 
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Ser Arq Phe Trp Gly Ser Val Ala Tyr Lys Asn He Val Gly Ser Pro 
225 230 235 240 




Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
260 265 270 

Phe Lys Ser Val Gly Gly Leu Glu Lys He He Lys Lys Glu Asn Ala 
275 280 285 



Thr His * 
290 

( 2 ) ANGABEN ZU SEQ ID NO: 3 : 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 267 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM : be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC003 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..267 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 3: 

ATG GAA TCA CAA CTC ATG AAA CTC GCC ATT GAG ACT TAT AAA ATC ACT 4 8 

Met Glu Ser Gin Leu Met Lys Leu Ala He Glu Thr Tyr Lys He Thr 
295 300 305 

TTG ATG ATT TCT TTA CCG GTA TTA TTA GCG GGC TTA GTG GTG GGG CTA 96 
Leu Met He Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
310 315 320 

TA GTC AGT ATT TTT CAA GCG ACC ACT CAA ATC AAT GAA ATG ACC TTG 144 
eu Val Ser He Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
325 330 335 

TCT TTT GTG CCT AAG ATT TTA GCC GTG ATT GGG GTG CTG ATT TTA ACC 192 
Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
340 345 350 355 

ATG CCG TGG ATG ACT AAC ATG CTT TTA GAT TAC ACC AAA ACC TTA ATC 240 

- — -r -n m rnl, -w~ t T>Vi -v T.aii Tl a 

360 



ATG CCG TGG ATG ACT AACJ AIU uii vj^a x^v- - * — " 
Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
365 370 



AAG CTC ATT CCT AAA ATC ATA GGC TAG 
Lys Leu He Pro Lys He He Gly * 
375 380 



267 



(2) ANGABEN ZU SEQ ID NO: 4: 



5 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 89 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 4: 

Met Glu Ser Gin Leu Met Lys Leu Ala lie Glu Thr Tyr Lys lie Thr 
15 10 15 

Leu Met lie Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val' Gly Leu 
20 25 30 

Leu Val Ser He Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
35 40 45 

Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
50 55 60 



0 



et Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
65 70 75 80 



Lys Leu He Pro Lys He He Gly * 

85 

(2) ANGABEN ZU SEQ ID NO: 5: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 714 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC005 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..714 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

ATG CCT ATT AAC CCT CTC TAT CTT TTC CCT AAT CTT TTT ACC GCT AGC 48 
Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
90 95 100 105 

AGT ATT TTT TTA GGC ATG ATG AGT ATT TTT TAC GCT TCC AGT TAC CAA 96 
Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
110 115 120 

TTT GTC ATG GCG TGT TGG TTA GTG GTA GCG AGC CTT ATT TTA GAC GGG 144 
Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
125 130 135 

CTT GAT GGG CGT GTC GCA AGG CTT ACC AAC ACC ACC AGC AAG TTT GGT 192 
Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
140 145 150 



ATA GAA TTT GAC TCA CTG GCT GAT GTA ATC GCT TTT GGG GTA GCC CCA 
lie Glu Phe Asp Ser Leu Ala Asp Val lie Ala Phe Gly Val Ala Pro 
155 160 165 

AGC TTA ATC ACT TAC TTT TAT GTG GGG TAT AAC TTT GGG CGC ATA GGC 
Ser Leu lie Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg He Gly 
170 175 180 185 

ATG GCG GTG AGC GCG TTG TTT GTG ATT TTT GGA GCG ATA CGA TTG GCA 
Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala lie Arg Leu Ala 
190 195 200 

CGA TTC AAT ATC AGC ACC AAC ACA AGC GAC CCC TAT TCT TTT ATC GGT 
Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
205 210 215 

ATC CCC ATT CCT GCG GCG GCG GTA TTG GTG GTG CTT TGT GTG TTA TTG 
He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
220 225 230 



^^GA' 



T AAC AAA TAC CAT TTT TTA GAA GGA AAT ACC GAA AAG TTA TTT TTA 
sp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
235 240 245 



AGC TTT ATT GTT TTA TTG GGG GTG CTT ATG GTG AGC AAT ATC CGC TAC 
Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
250 255 260 265 

CCT AAT TTT AAA AAA GTC AAA TGG AAT CTC AAG CTT TTT ATC TTA GTG 
Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
270 275 280 

TTG ATT TTT TTA TCG TTA GTG TTT GTG CGC CCT TTA GAG GCT TTA AGC 
Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
285 290 295 

GTG TTT ATG GGG TTG TAT TTG ATT TAT GGC ATC ATT CGG TGG CTT TTT 
Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
300 305 310 

TTA ATG GTA AAA ATT ATT TTT AAT AAA AAT AAA AGT GCA TGA 
Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
315 320 325 



) ANGABEN ZU SEQ ID NO: 6: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE : 238 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 6: 

Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
1 5 10 15 

Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
20 25 30 



Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
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35 40 45 

Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
50 55 60 

lie Glu Phe Asp Ser Leu Ala Asp Val lie Ala Phe Gly Val Ala Pro 
65 70 75 80 

Ser Leu lie Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg lie Gly 

85 90 95 

Met Ala Val Ser Ala Leu Phe Val lie Phe Gly Ala He Arg Leu Ala 
100 105 110 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
115 120 125 



He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
130 135 140 



• 



sp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
45 150 155 160 



Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
165 170 175 

Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
180 185 190 

Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
195 200 205 

Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
210 215 220 

Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
225 230 235 

(2) ANGABEN ZU SEQ ID NO: 7: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 552 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC029 (HPC030) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..552 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

ATG GCA GAA GAA CAA GAA AAT ACC GCG CAA CAA CCC CAA AAA AAA AGC 48 
Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
240 245 250 
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• 



AAA GCC CTT TTA TTT GTC ATT ATT GGA AGC GTG TTA GTG ATG CTT TTG 
Lys Ala Leu Leu Phe Val lie lie Gly Ser Val Leu Val Met Leu Leu 
255 260 265 270 

TTG GTG GGG GTG ATT ATC ATG CTG CTT ATG GGG AAT AAG GAA GAA TCC 
Leu Val Gly Val lie lie Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
275 280 285 

AAA GAA AAC GCT TCT AAA AAC ACC CAA GAA GTC CAA GCT AAT CCT ATG 
Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
290 295 300 

GCG AAC AAA AAT CAA GAA GCC AAA GAA GGC TCT AAT ATC CAG CAA TAT 
Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn lie Gin Gin Tyr 
305 310 315 

CTG GTG CTT GGG CCT TTG TAT GCG ATT GAT GCG CCT TTT GCG GTG AAT 
Leu Val Leu Gly Pro Leu Tyr Ala lie Asp Ala Pro Phe Ala Val Asn 
320 325 330 

TG GTT TCT CAA AAT GGC AGA CGC TAC CTT AAG GCT TCC ATT TCG TTA 
eu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser lie Ser Leu 
35 340 345 350 

GAA TTG AGC AAT GAA AAG CTT TTA AAT GAA GTC AAG GTT AAA GAC ACA 
Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
355 360 365 

GCG ATT AAG GAC ACG ATT ATA GAG ATT CTA TCG TCT AAA AGC GTG GAA 
Ala lie Lys Asp Thr lie lie Glu lie Leu Ser Ser Lys Ser Val Glu 
370 375 380 

GAA GTG GTT ACT AAC AAA GGT AAA AAC AAG CTT AAA GAT GAA ATT AAG 
Glu Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu lie Lys 
385 390 395 

AGC CAT TTG AAT TCG TTT TTG ATT GAT GGC TTT ATT AAA AAT GTC TTT 
Ser His Leu Asn Ser Phe Leu lie Asp Gly Phe lie Lys Asn Val Phe 
400 405 410 

TTC ACT GAT TTC ATT ATT CAA TAA 
Phe Thr Asp Phe He He Gin * 
415 420 



) ANGABEN ZU SEQ ID NO : 8: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 184 Aminosauren 

(B) ART : Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
15 10 15 

Lys Ala Leu Leu Phe Val He He Gly Ser Val Leu Val Met Leu Leu 
20 25 30 



Leu Val Gly Val He He Met Leu Leu Met Gly Asn Lys Glu Glu Ser 



35 40 45 

Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
50 55 60 

Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn lie Gin Gin Tyr 
65 70 75 80 

Leu Val Leu Gly Pro Leu Tyr Ala lie Asp Ala Pro Phe Ala Val Asn 

85 90 95 

Leu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser lie Ser Leu 
100 105 110 

Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
115 120 125 



Ala lie Lys Asp Thr lie lie Glu lie Leu Ser Ser Lys Ser Val Glu 
130 135 140 



lu Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu lie Lys 
45 150 155 160 



Ser His Leu Asn Ser Phe Leu lie Asp Gly Phe lie Lys Asn Val Phe 
165 170 175 

Phe Thr Asp Phe lie lie Gin * 
180 

(2) ANGABEN ZU SEQ ID NO: 9: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 858 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS042 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..858 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

ATG AAA GAG TTT AAG ATT CTA ATC ATC CTC ATT GTG GTG GTA GGC GTG 
Met Lys Glu Phe Lys lie Leu lie lie Leu lie Val Val Val Gly Val 
185 190 195 200 

ATT TAT TAT GGG GTT GAG CCT TAT GCG CAT TCG GTG ATG CAC CCT AAA 
lie Tyr Tyr . Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
205 210 215 

GTC GCT CCG GCA GAT TTT GCT TTC AAG GAT TTA GAG CCG ATG GAT TTA 
Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
220 225 230 



AAA AAT GGC GAT GCT AAT AAG GGC AAA CAG CTT GTA GCT GAA AAT TGC 
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Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
* 235 240 245 

ACC GCT TGC CAT GGC ATT AAA TCC CAA AAC ATT CCA GCC CCT ATG GAC 240 
Thr Ala Cys His Gly lie Lys Ser Gin Asn lie Pro Ala Pro Met Asp 
250 255 260 

AGC CTT AGC GCG AGC AAC TCT TTT GGG GTC GTG CCA CCG GAT TTA AGC 288 
Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
265 270 275 280 

CAT GTG GCG GGG GTT TTG AAC GCG AAT TTC TTA GCC CAC TTC ATC AAA 336 
His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe lie Lys 
285 290 295 

GAC CCT GTA AAA ACG GCG AAA TTG AGC CAT AAG TTC AAC GAT GAA AGG 3 84 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
300 305 310 

CCC TAT CCT ATG CCG GCG TTT TCT CAA TTT AGC GAT AAA GAC TTG AGC 432 
ro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
315 320 325 

GAT ATT GTG GCG TAT CTC ACT TCT ATT TTG CCT AAA AAT TTG AGC GAT 480 
Asp lie Val Ala Tyr Leu Thr Ser lie Leu Pro Lys Asn Leu Ser Asp 
330 335 340 

AAG GAA GTG TTC GCG CAA AGC TGT CAA AGG TGC CAT AGC TTG GAT TAT 528 
Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
345 350 355 360 

GCG AAA GAT AAG GCC TTT AGC GAT CCT AAA GAT CTA GCC AAT TAT TTA 576 
Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
365 370 375 

GGC TCT CAT GCA CCT GAT TTG TCC ATG ATG ATT AGA GCT AAA GGC GAA 624 
Gly Ser His Ala Pro Asp Leu Ser Met Met lie Arg Ala Lys Gly Glu 
380 385 390 

CAT GGT TTG AAT ATT TTC ATC AAC GAT CCG CAA AAG CTT TTG CCT GGC 672 
His Gly Leu Asn lie Phe lie Asn Asp Pro Gin Lys Leu Leu Pro Gly 
395 400 405 



!G GCT ATG CCC AGA GTG GGA TTG AGT GAA CAA GCT CAA AAA CAA GTC 720 
r Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
410 415 420 



ATC GCA TAT TTG GAA AAA GCA GGC GAT AGG AAA AAA CAT GAA AGG AAT 768 
lie Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
425 430 435 440 

ACC TTA GGG ATA AAA ATC ATG ATT TTC TTT GCG GTG CTG TCG TTC TTG 816 
Thr Leu Gly lie Lys lie Met lie Phe Phe Ala Val Leu Ser Phe Leu 
445 450 455 

GCT TAT GCG TGG AAA AGA AAA GTT TGG AGC GAA GTG CAT TGA 858 
Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
460 465 470 



(2) ANGABEN ZU SEQ ID NO: 10: 



11 





(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 286 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Lys Glu Phe Lys lie Leu lie lie Leu lie Val Val Val Gly Val 
15 10 15 

lie Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
20 25 30 

Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
35 40 45 

Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
50 55 60 

hr Ala Cys His Gly He Lys Ser Gin Asn He Pro Ala Pro Met Asp 
65 70 75 80 

Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
85 90 95 

His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe He Lys 
100 105 110 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
115 120 125 

Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
130 135 140 

Asp He Val Ala Tyr Leu Thr Ser He Leu Pro Lys Asn Leu Ser Asp 
145 150 155 160 

Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
165 170 175 

Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
180 185 190 

y Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
195 200 205 

His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
210 215 220 

Thr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
225 230 235 240 

He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
245 250 255 

Thr Leu Gly He Lys He Met He Phe Phe Ala Val Leu Ser Phe Leu 
260 265 270 

Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
275 280 285 
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(2) ANGABEN ZU SEQ ID NO: 11: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 192 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



► 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPC057 (HPC109, HPC138) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..192 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

ATG AAT ACA GAA ATT TTA ACC ATC ATG TTA GTT GTC TCA GTG CTT ATG 
et Asn Thr Glu lie Leu Thr lie Met Leu Val Val Ser Val Leu Met 
290 295 300 



GGA TTG GTA GGC TTA ATA GCG TTT TTG TGG GGG GTT AAA AGC GGT CAG 
Gly Leu Val Gly Leu lie Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
305 310 315 

TTT GAC GAT GAA AAA CGC ATG CTT GAA AGC GTG TTG TAT GAC AGC GTG 
Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
320 325 330 

AGC GAT TTG AAC GAA GCG ATT TTA CAA GAA AAA CGC CAA AAG AAT TAA 
Ser Asp Leu Asn Glu Ala lie Leu Gin Glu Lys Arg Gin Lys Asn * 
335 340 345 350 

(2) ANGABEN ZU SEQ ID NO: 12: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 64 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Asn Thr Glu lie Leu thr lie Met Leu Val Val Ser Val Leu Met 
15 10 15 

Gly Leu Val Gly Leu lie Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
20 25 30 

Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
35 40 45 

Ser Asp Leu Asn Glu Ala lie Leu Gin Glu Lys Arg Gin Lys Asn * 
50 55 60 



(2) ANGABEN ZU SEQ ID NO: 13: 



13 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS062 (HPS171) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..957 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 13: 

ATG CCC GAT TCT GCG AAC ATG ATC ATT TTA TTT TTC ACC TAT GAT ATT 48 
Met Pro Asp Ser Ala Asn Met lie lie Leu Phe Phe Thr Tyr Asp lie 
65 70 75 80 




■TA TTC GCT CTC AAT TAC ACC TTG CCC ATT TCC TTG CTT TTG GCG ATG 96 
Leu Phe Ala Leu Asn Tyr Thr Leu Pro He Ser Leu Leu Leu Ala Met 
85 90 95 

GTT TTA TTT TAT ATC GCA TTC ATT AAA TCC AAC CAA TAC ACC GCC CTG 144 
Val Leu Phe Tyr He Ala Phe He Lys Ser Asn Gin Tyr Thr Ala Leu 
100 105 110 

CTC TCC ATT GGC TTT TCC AAA TGC CAG ATT TTA AGC CCT ATT TTT TTG 192 
Leu Ser He Gly Phe Ser Lys Cys Gin He Leu Ser Pro He Phe Leu 
115 120 125 

ATT AGT CTG TTT TTC ACG GCT ATT TAT GTG GGG TTG AAC GCG ACT CCT 240 
He Ser Leu Phe Phe Thr Ala He Tyr Val Gly Leu Asn Ala Thr Pro 
130 135 140 

TTT GTG TAT ATG GAA GAA AAA ACG CAA AAT TTA ATC TAT AAA GAC AAT 288 
Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu He Tyr Lys Asp Asn 
145 150 155 160 

TCT TTG AGC GTC TCA GAG CAT TTG TTA GTG AAA TAT AAC GAT GAT TAC 336 
er Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
165 170 175 

GTG TAT TTT GAT AAG ATT AAT CCC CTA TTG CAA AAA GCC CAA AAC ATC 384 
Val Tyr Phe Asp Lys He Asn Pro Leu Leu Gin Lys Ala Gin Asn He 
180 185 190 

AAG GTT TTT CGC CTA AAA GAT AAG ACT TTA GAA TCT TAC GCT GAA GCT 432 
Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
195 200 205 

AAA GAA GCT TTT TTT GAA GAC AAG TAT TGG ATT TTG CAT GAC ACT ACT 480 
Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp He Leu His Asp Thr Thr 
210 215 220 

ATC TAT GAG ATG CCC TTG AGT TTT GAA CTG GGT GCA AAC GCT TTA AGC 52 8 

He Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
225 230 235 240 
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ACC ACG CGT TTA AAA ACC TTT AAA ACG CTC AAA AAT TTC CGC CCT AAA 
Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
245 250 255 

GTT TTA GAC ACC ATT TAT CAA AAC AAG CCC GCG GTT TCT ATC ACA GAC 
Val Leu Asp Thr lie Tyr Gin Asn Lys Pro Ala Val Ser lie Thr Asp 
260 265 270 

GCT CTT TTA TCT TTG CAT GCT TTA GTG CGC CAA AAC GCA GAC ACG AAA 
Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
275 280 285 

AAA GTG CGA TCG TTT TTG TAT GTG TTT GCG ATT TTG CCC TTT TTT GTG 
Lys Val Arg Ser Phe Leu Tyr Val Phe Ala lie Leu Pro Phe Phe Val 
290 295 300 

CCG TTT TTA AGC GTT TTA ATC GCT TAT TTT TCG CCC AGT CTC GCC CGC 
Pro Phe Leu Ser Val Leu lie Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
305 310 315 320 



AT GAA AAC CTG GCT CTT TTA GGG CTA AAG TTT ATC ATT ATC ACG CTC 
r Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe lie lie lie Thr Leu 
325 330 335 



GTT GTT TGG GGG CTA TTC TTT GCT TTA GGG AAG TTC AGC ATT TCA GGG 
Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser lie Ser Gly 
340 345 350 

ATA CTC ATT CCT GAA ATA GGC GTG CTA TCG CCC TTT TTT ATA TTC TTA 
lie Leu lie Pro Glu lie Gly Val Leu Ser Pro Phe Phe lie Phe Leu 
355 360 365 

GCT CTT AGT CTT TGG TAT TTT AAA AAG CTT AAT AAG AGG TTG TAG 
Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
370 375 380 



(2) ANGABEN ZU SEQ ID NO: 14: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Met Pro Asp Ser Ala Asn Met lie lie Leu Phe Phe Thr Tyr Asp lie 
1 5 10 15 

Leu Phe Ala Leu Asn Tyr Thr Leu Pro lie Ser Leu Leu Leu Ala Met 
20 25 30 

Val Leu Phe Tyr lie Ala Phe lie Lys Ser Asn Gin Tyr Thr Ala Leu 
35 40 45 

Leu Ser lie Gly Phe Ser Lys Cys Gin lie Leu Ser Pro lie Phe Leu 
50 55 60 



lie Ser Leu Phe Phe Thr Ala lie Tyr Val Gly Leu Asn Ala Thr Pro 
65 70 75 80 
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Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu lie Tyr Lys Asp Asn 

85 90 95 

Ser Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
100 105 110 

Val Tyr Phe Asp Lys lie Asn Pro Leu Leu Gin Lys Ala Gin Asn lie 
115 120 125 

Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
130 135 140 

Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp lie Leu His Asp Thr Thr 
145 150 155 160 

lie Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
165 170 175 

Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
180 185 190 

al Leu Asp Thr lie Tyr Gin Asn Lys Pro Ala Val Ser lie Thr Asp 
195 200 205 

Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
210 215 220 

Lys Val Arg Ser Phe Leu Tyr Val Phe Ala lie Leu Pro Phe Phe Val 
225 230 235 240 

Pro Phe Leu Ser Val Leu lie Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
245 250 255 

Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe lie lie lie Thr Leu 
260 265 270 

Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser lie Ser Gly 
275 280 285 

He Leu lie Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
290 295 300 

^la Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
)5 310 315 



^^12) ANGABEN ZU SEQ ID NO: 15: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1629 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 

(B) CLON(E) : HPS065 (HPS153) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1629 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 



ATG AAT AAA CCA TTT TTA ATC TTA CTC ATA GCC CTA ATT GTC TTT AGC 
Met Asn Lys Pro Phe Leu lie Leu Leu lie Ala Leu lie Val Phe Ser 
320 325 330 335 

GGC TGT AAC ATG AGA AAA TAT TTC AAA CCC GCT AAA CAC CAA ATT AAA 
Glv Cvs Asn Met Arq Lys Tyr Phe Lys Pro Ala Lys His Gin lie Lys 
340 345 350 

GGC GAA GCG TAT TTC CCT AAC CAT TTG CAA GAA AGT ATC GTT TCG TCT 
Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser He Val Ser Ser 
355 360 365 

AAT CGT TAT GGA GCC ATT TTG AAA AAT GGA GCG GTT ATA GGC GAT AAA 
Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
370 375 380 



GGT TTA ACG CAG CTA AGA ATC GGT AAG AAC TTC AAT TAC GAA AGC AGT 
Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
385 390 395 



_ _'T TTA AAT GAG AGT CAA GGG TTT TTT ATT CTT GCG CAA GAT TGT TTG 
Phe Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 
400 405 410 415 

AAC AAG ATT GAT AAA AAA ACA AAC AAA AGC AAG GTG GCT AAG ACT GAA 
Asn Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
420 425 430 

GAA ACG GAA TTG AAA TTA AAG GGC GTT GAA GCG GAA GTC CAA GAT AAA 
Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
435 440 445 

GTC TGT CAT CAA GTG GAA TTG ATT AGC AAT AAC CCT AAC GCC AGC CAA 
Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
450 455 460 

CAA TCT ATC GTT ATT CCT TTG GAG ACT TTT GCC TTG AGC GCA AGC GTT 
Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
465 470 475 



GGG AAT CTT TTA GCG GTG GTG TTA GCG GAC AAT TCA GCG AAC TTA 
s Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 

485 490 495 



TAC GAC ATC ACT TCT CAA AAA TTG CTT TTT AGT GAG AAA GGT TCC CCA 
Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
500 505 510 

AGC ACC ACG ATC AAT TCT TTA ATG GCG ATG CCT ATT TTT ATG GAT ACG 
Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
515 520 525 

GTC GTG GTG TTC CCC ATG CTA GAT GGG CGC TTG TTG GTC GTG GAT TAT 
Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
530 535 540 

GTG CAC GGA AAC CCT ACG CCT ATT AGA AAC ATT GTT ATC AGC AGC GAT 
Val His Gly Asn Pro Thr Pro He Arg Asn He Val He Ser Ser Asp 
545 550 555 
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AAG TTT TTT AAC AAT ATC ACC TAC CTT ATC GTA GAT GGC AAT AAC ATG 768 
Lys Phe Phe Asn Asn He Thr Tyr Leu He Val Asp Gly Asn Asn Met 
560 565 570 575 

ATC GCT TCT ACA GGG AAA AGG ATA CTC TCA GTA GTG AGC GGT CAA GAG 816 
He Ala Ser Thr Gly Lys Arg He Leu Ser Val Val Ser Gly Gin Glu 
580 585 590 

TTC AAC TAT GAT GGG GAT ATT GTG GAT TTG CTT TAT GAT AAG GGG ACT 864 
Phe Asn Tyr Asp Gly Asp He Val Asp Leu Leu Tyr Asp Lys Gly Thr 
595 600 605, 

TTA TAT GTG CTC ACG CTA GAC GGG CAG ATT TTG CAA ATG GAT AAG AGT 912 
Leu Tyr Val Leu Thr Leu Asp Gly Gin He Leu Gin Met Asp Lys Ser 
610 615 620 

TTG AGG GAA TTA AAC AGC GTG AAA CTG CCT TCG TCG CTC AAC ACG ATT 960 
Leu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr He 
625 630 635 

TA TTA AAC CAT AAT AAA TTG TAT TCT TTA GAA AAA CGA GGG TAT GTG 100 8 

al Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
40 645 650 655 

ATA GAG GTG GAT TTA AAT GAT TTT GAT TCG TAT AAT GTC TAT AAA ACG 1056 
He Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
660 665 670 

CCA ACT ATA GGC AGT TTT AAG TTT TTT TCA TCT AAT CGT TTG GAT AAA 1104 
Pro Thr He Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
675 680 685 

GGG GTG TTT TAT GAT AAA AAT CGG GTG TAT TAC GAT CGC TAC TAT TTA 1152 
Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
690 695 700 

GAT TAT AAC GAT TTT AAA CCA AAA CTT TAT CCC GTT GTG GAA AAA TCG 1200 
Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
705 710 715 



e- 



GCA TCT AAA AAA TCT CAA AAA GGC GAA AAA GGG AAC GCT CCT ATT TAT 124 8 

Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro He Tyr 
20 725 730 735 



, G CAA GAA AGG CAT AAA GCT AAA GAA AAT AAA CAG CCT TTA GAA GAA 1296 
ieu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
740 _ 745 750 

AAC AAA GTT AAA CCA AGA AAT AGC GGG TTT GAA GAA GAA GAG GTT AAA 1344 
Asn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
755 760 765 

ACC AGA AGG CCT GAG CCT ATT AGG GAT CAA AAT AAC GCC ACC CAA CAA 1392 
Thr Arg Arg Pro Glu Pro He Arg Asp Gin Asn Asn Ala Thr Gin Gin 
770 775 780 

GGC GAA ACA AAA AAC AAT GAA AGT AAA AAC GCT CCT GTC TTA AAA GAA 144 0 

Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
785 790 795 

AAC GCC GCT AAA AAA GAA GTG CCA AAA CCA AAT TCT AAA GAA GAA AAA 1488 
Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
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800 

CGC CGC TTG 
Arg Arg Leu 



AGA GAA TTT 
Arg Glu Phe 



GAG CTT GAA 
Glu Leu Glu 
850 



805 

AAA GAA GAA 
Lys Glu Glu 
820 

GAA CAA AGA 
Glu Gin Arg 
835 

GAA AGA AGA 
Glu Arg Arg 



AAG AAA AAA 
Lys Lys Lys 



GCG AGA GAG 
Ala Arg Glu 
840 

AAA GCT TTA 
Lys Ala Leu 
855 



810 

GCC AAA GCC 
Ala Lys Ala 
825 

CAT CAA GAA 
His Gin Glu 



GAA ATG AAT 
Glu Met Asn 



GAA CAA AGA 
Glu Gin Arg 
830 

AGA GAT GAA 
Arg Asp Glu 
845 

AAG AAG TAG 
Lys Lys * 
860 



815 

GCG 1536 
Ala 

AAA 1584 
Lys 

1629 



(2) ANGABEN ZU SEQ ID NO: 16: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 543 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Asn Lys Pro Phe Leu lie Leu Leu lie Ala Leu lie Val Phe Ser 
15 10 15 

Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin lie Lys 
20 25 30 

Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser lie Val Ser Ser 
35 40 45 

Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
50 55 60 

Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
65 70 75 80 

Phe Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 
85 90 95 



n Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
100 105 110 



Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
115 " 120 125 

Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
130 135 140 

Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
145 150 155 160 

Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
165 170 175 

Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
180 185 190 

Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
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195 200 205 

Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
210 215 220 

Val His Gly Asn Pro Thr Pro lie Arg Asn lie Val lie Ser Ser Asp 
225 230 235 240 

Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
245 250 255 

lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
260 265 270 

Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
275 280 285 

Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
290 295 300 



Leu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
1 05 310 315 320 



Val Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
325 330 335 

lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
340 345 350 

Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
355 360 365 

Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
370 375 380 

Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
385 390 395 400 

Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
405 410 415 

Leu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
420 425 430 

sn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
435 440 445 

Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
450 455 460 

Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
465 470 475 480 

Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
485 490 495 

Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
500 505 510 

Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
515 520 525 



Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
530 535 540 



(2) ANGABEN ZU SEQ 10 NO: 17: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1377 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 




(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS066 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1. -13.77 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

r ATG CTT GAA ACT TCT AGC CAT TTT TTA AAA TCG TTT CGC TTG AAG CGT 
Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
545 550 555 

TAT ATA GGG TTT TTA TTG ATT TCT TTA GCG TTA TTA ATC ACG CCC TTT 
Tyr lie Gly Phe Leu Leu lie Ser Leu Ala Leu Leu lie Thr Pro Phe 
560 565 570 575 

GTT CGC ATT GAT GGG GCG CAT TTG TTT TTG ATC TCT TTT GAG CAT AAG 
Val Arg lie Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
580 585 590 

CAA CTG CAT TTT TTA GGC AAG ATC TTT AGC GCT GAA GAA TTG CAA GTC 
Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
595 600 605 

ATG CCT TTT ATG GTT ATT TTG CTT TTT ATA GGG ATT TTT TTC ATC ACC 
Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
610 615 620 



t CT AGC CTT GGG CGT GTG TGG TGC GGT TGG GCT TGC CCG CAA ACC TTT 
x Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
625 630 635 



TTA AGG GTG CTT TAT AGA GAT GTG ATT GAA ACC AAG ATT TTC AAA CTC 
Leu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
640 645 650 655 

CAT AAA AAG ATC AGC AAC AAG CAA GAA AGC CCT AAA AAC ACC CCA AGC 
His Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
660 665 670 

TAC AAG ATC CGT AAA GTA TTG AGC GTT TTA TTG TTC GCT CCT GTT GTG 
Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
675 680 685 

GCG GGG CTA ATG ATG TTG TTT TTC TTT TAT TTC ATC GCC CCA GAA GAT 
Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
690 695 700 



TTT TTT ATG TAT CTT AAA AAC CCT AGC GAT CAC CCT ATT GCT ATG GGT 
Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro lie Ala Met Gly 
705 710 715 

TTT TGG CTT TTT AGC ACG GCT GTG GTG CTA TTT GAT ATA GTG GTG GTT 
Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp lie Val Val Val 
720 725 730 735 

GCG GAG CGT TTT TGC ATT TAT TTA TGC CCT TAC GCT AGG GTG CAA TCG 
Ala Glu Arg Phe Cys lie Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
740 745 750 

GTG TTG TAT GAC AAT GAC ACC TTA AAC CCT ATT TAT GAT GAA AAG CGC 
Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp Glu Lys Arg 
755 760 765 

GGC GGA GCG CTT TAT AAT AAT CAG GGC CAT CTC TTC CCC TTA CCT CCC 
Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
770 775 780 



ys 



AAA CGC AGC CCA GAA AAC GAA TGC GTG AAT TGT TTG CAT TGC GTG 
ys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
785 790 795 



CAG GTT TGC CCC ACG CAT ATT GAC ATC AGG AAG GGC TTG CAA TTA GAA 
Gin Val Cys Pro Thr His lie Asp lie Arg Lys Gly Leu Gin Leu Glu 
800 805 810 815 

TGC ATC AAT TGT TTA GAA TGC GTG GAT GCA TGC ACG ATT ACC ATG GCT 
Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr lie Thr Met Ala 
820 825 830 

AAA TTT AAC CGC CCT TCA CTC ATC CAA TGG TCT TCA ACT AAC GCT ATT 
Lys Phe Asn Arg Pro Ser Leu lie Gin Trp Ser Ser Thr Asn Ala lie 
835 840 845 

AAT ACG CGC CAA AAA GTG CAC CTG GTG CGT TTA AAA ACG ATC GCT TAC 
Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr lie Ala Tyr 
850 855 860 

ATG GGG GTT ATC GCT ATT GTG ATC GCT CTT TTA GCC ATC ACT TCG TTT 
Met Gly Val lie Ala lie Val lie Ala Leu Leu Ala He Thr Ser Phe 
865 870 875 



AAA GAA CGC ATG CTC TTA GAC ATT AAC CGC AAC AGC GAT CTG TAT 
s Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
880 885 890 895 

GAA TTG CGC TCT AGC GGG TAT GTG GAT AAC GAT TAC GTG TTT TTA TTC 
Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
900 905 910 

CAC AAC ACG GAC AAT AAA GAC CAT GAG TTT TAT TTC AAA GTT TTA GGG 
His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
915 920 925 

CAA AAA GAC ATT CAG ATC AAA AAG CCT TTA AAT CCT ATC GCC ATT AAA 
Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
930 935 940 



GCC GGG CAA AAG ATT AAA GCG GTA GTG ATT TTA AGA AAA CCC CTA AAG 
Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
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945 950 955 

AGT AAC GCC ACA GAA TAG AAG AAC GCT AAA GAC GCT CTA ATC CCC ATT 1296 
Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu lie Pro lie 
960 965 970 975 

ACC ATA CAA GCT TAT AGC GCG GAC GAT AAG AAT ATT ACG ATA GAA AGG 1344 
Thr lie Gin Ala Tyr Ser Ala Asp Asp Lys Asn lie Thr lie Glu Arg 
980 985 990 

GAA TCG GTG TTT ATT GCA CCA AGT GAG GAT TGA 1377 
Glu Ser Val Phe lie Ala Pro Ser Glu Asp * 
995 1000 

(2) ANGABEN ZU SEQ ID NO: 18: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 459 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
15 10 15 

Tyr He Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
20 25 30 

Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
35 40 45 

Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
50 55 60 

Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
65 70 75 80 

Thr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
85 90 95 

eu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
L 100 105 110 

His Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
115 " 120 125 

Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
130 135 140 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
145 150 155 160 

Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro He Ala Met Gly 
165 170 175 

Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp He Val Val Val 
180 185 190 

Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 



4 
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X95 200 205 

Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp Glu Lys Arg 
210 215 220 

Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
225 230 235 240 

Lys Lys Arq Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
245 250 255 

Gin Val Cys Pro Thr His lie Asp lie Arg Lys Gly Leu Gin Leu Glu 
260 265 270 

Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr lie Thr Met Ala 
275 280 285 

Lys Phe Asn Arg Pro Ser Leu He Gin Trp Ser Ser Thr Asn Ala He 
290 295 300 



• 



sn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr He Ala Tyr 
05 310 315 320 



Met Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
325 330 335 

Lys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
340 345 350 

Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 

355 360 365 

His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
370 375 380 

Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
385 390 395 400 

Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
405 410 415 



Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu He Pro He 
420 425 430 



r He Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
435 440 445 

Glu Ser Val Phe He Ala Pro Ser Glu Asp * 
450 455 

(2) ANGABEN ZU SEQ ID NO: 19: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1533 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS068 



(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1533 





(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 19: 

ATG AAA AAA ACA ACC CTC TTT GTA TTG GGC TTA TTA TTT AAT AGC TTT 
Met Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
460 465 470 475 

TTA AAT GCT GTT GAT GGG ATT TCT AAA ACC GAT CTT TCT TCT* TTG AAT 
Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
480 485 490 

TTG GCT GAA GAC AGC GCG CCT TTG AAC CAT CCT AAC GCT CAA AAA CTC 
Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
495 500 505 

TCC TTA AAA AAC GCA TGG ACT AGG GTA TTG TCT AAC CAT GAA GGC TTG 
er Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
510 515 520 

CAT GCG CAA GAA TAC GCC ATT AAG CGA GCG AGT AAA ATG AAA TTA GCG 
His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
525 530 535 

GCT AAA CTT TCT TTT TTG CCT CAA ATT GAT TTG AGC GCT TTT TAT GTG 
Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 
540 545 550 555 

TAT CTC TCT AAC CCC ATT AAA ATG GAT TTT GCC AGC CAA AAA CAA CCG 
Tyr Leu Ser Asn Pro lie Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
560 565 570 

GGC GTG CAA AAA GCC ACC AAC CAG ATC CAT CAA GGC ATA CAA AAC ATC 
Gly Val Gin Lys Ala Thr Asn Gin lie His Gin Gly lie Gin Asn lie 
575 580 585 

CAG CAA AAT ATC CCT TCT CAA GTA TTA ACC CCT CAA ATC CAA GCG GGC 
Gin Gin Asn lie Pro Ser Gin Val Leu Thr Pro Gin lie Gin Ala Gly 
590 595 600 

V TG CAA GGG GTG ATG CAA GGT TTT GGG GCT TTG AGC AGC ACT TTA GAA 
t Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
605 610 615 

GCC CCC TTA TTG TTT TCT AAG CAA AAT GTG GTG ATT GGG GCT TTG AGC 
Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val lie Gly Ala Leu Ser 
620 625 630 635 

ATT ATT TAT CCC CTT TAT ATG GGT GGG GCA AGA TTC ACG ATG GTG CGC 
lie lie Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
640 645 650 

ATT GCG GAT TTG ATG CAA AAA GAT GCT AAT GAA GTG TAT CGT TTG AAA 
lie Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
655 660 665 

AAG CTT TCC ACT TTT CAA GAG CTT GTG AGC GTG TAT TAC GGC ATG GTG 
Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
670 675 680 



TTA AAC GCA GAA GTG GCT GAA ACT TTA GAA GAG GTG GAA AAA GGC CAT 
Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
685 690 695 

TAT AAG CAT TTC CAA AAC GCT TTG AAA ATG CAA AAA GTG GGG CAA ATC 
Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin He 
700 705 710 715 

GCT AGG GTA GAA ACC TTA GGC GCT CAA GTG GCT TAT GAT AAG GCC CAT 
Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
720 725 . 730 

ATC GCT AGC GTT AAG GCT AAA GAC GTG TTA GAA GTT TCG CAG CTC TCG 
He Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
735 740 745 

TTC AAT TCC ATT TTA TCT AGC AAG GAC GAT TTA GTG CCT TCA AGC AAA 
Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
750 755 760 

TA GAG ATC CGC ACG GAG AAA AAT CTG CCC GAT CTG AGC TTT TTT GTT 
eu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
765 770 775 

TCT TCC ACG CTC AAT TCC TAC CCG GTT TTA AAG ACT TTA GAA AAT CAG 
Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
780 785 790 795 

ATT CAA ATC TCT AAA GAA AAC ACG AAA TTA CAG ATC GCT AAA TTC TTG 
He Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
800 805 810 

CCC CAA GTG AGT TTT TTT GGC TCT TAT ATT ATG AAG CAA AAC AAT TCG 
Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
815 820 825 

GTG TTT GAA GAC ATG ATC CCT AGT TGG TTT GTG GGC GTG GCC GGG CGC 
Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
830 835 840 

ATG CCT ATT CTT TCT CCC ACA GGG CGC ATT CAA AAA TAC CAA GCG AGC 
Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
845 850 855 



TTA GCG GAG TTG CAA GTG AGT AGC GAA CAA ATC CAG GCT AAA AAA 
ys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
860 865 . 870 875 

AAC ATG GAA TTA TTA GTG AAT AAG ACT TAT AAA GAG ACG CTT TCT TAT 
Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
880 885 890 

TTG AAA GAA TAC AAA AGC TTG CTT TCT AGC GTG GAA TTA GCC AAG GAA 
Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
895 900 905 

AAC TTA AAA CTC CAA GAG CAG GCT TTT TTA CAA GGC TTA AGC ACG AAC 
Asn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
910 915 920 



GCT CAA GTC ATT GAT GCG AGG AAC ACG CTT TCT TCT ATC GTC GTG GAG 
Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 



925 



930 



935 



CAA AAA AGC GTG GCT 
Gin Lys Ser Val Ala 
940 

GCG TTA AGC GAT CAT 
Ala Leu Ser Asp His 
960 



TAT AAA TAC ATC GTT 
Tyr Lys Tyr lie Val 
945 

ATT GAT TTA TTT TAT 
lie Asp Leu Phe Tyr 
965 



TCA TTA GCG AAT TTA ATG 
Ser Leu Ala Asn Leu Met 
950 955 

GAA TTT GTT TAT TAA 
Glu Phe Val Tyr * 
970 




(2) ANGABEN ZU SEQ ID NO: 20: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 511 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 20: 

et Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
15 10 15 

Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
20 25 30 

Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
35 40 45 

Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
50 55 60 

His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
65 70 75 80 

Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 
85 90 95 

Tyr Leu Ser Asn Pro lie Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
100 105 110 

Gly Val Gin Lys Ala Thr Asn Gin He His Gin Gly He Gin Asn He 
115 120 125 

In Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Gly 
130 135 140 

Met Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
145 150 155 160 

Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
165 170 175 

He He Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
180 185 190 

He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
195 200 205 

Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
210 215 220 
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Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
225 230 235 240 

Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin lie 
245 250 255 

Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
260 .265 270 

lie Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
275 280 285 

Phe Asn Ser lie Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
290 295 300 

Leu Glu lie Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
305 310 315 320 



Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
325 330 335 



le Gin lie Ser Lys Glu Asn Thr Lys Leu Gin lie Ala Lys Phe Leu 
340 345 350 




Pro Gin Val Ser Phe Phe Gly Ser Tyr lie Met Lys Gin Asn Asn Ser 
355 360 365 

Val Phe Glu Asp Met lie Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
370 375 380 

Met Pro lie Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
385 390 395 400 

Lys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
405 410 415 

Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
420 425 430 

Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
435 440 445 

^sn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
450 455 460 

la Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
465 470 . 475 480 

Gin Lys Ser Val Ala Tyr Lys Tyr He Val Ser Leu Ala Asn Leu Met 
485 490 495 

Ala Leu Ser Asp His He Asp Leu Phe Tyr Glu Phe Val Tyr * 
500 505 510 

(2) ANGABEN ZU SEQ ID NO: 21: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



2 8 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS074 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..957 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

ATG TTA AGT AGA GAC ATT GTC CAA TAT TCC AAG ATC CGC ACC GAG TTA 
Met Leu Ser Arg Asp lie Val Gin Tyr Ser Lys lie Arg Thr Glu Leu 
515 520 525 

TAC GCT TAT CTT ACC TAT TTG TTT TCG CAC AAT ATC CGC AAC CAC CTC 
Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn lie Arg Asn His Leu 
530 535 540 

CCT GAA ATC ACT TTG GAT TAT TTA AAC AAA CAG ATC AGA AAA ATG CAC 
ro Glu lie Thr Leu Asp Tyr Leu Asn Lys Gin lie Arg Lys Met His 
545 550 555 

GCT GAA ATC AAA ATG GCA AAA AAT TTT TTT GTG TTA GAC GCT AAG GGC 
Ala Glu lie Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
560 565 570 575 

ATG CTA ATT CTT AAG CCA AGC CAG CTT AAA GAG CAG GGG CAT AAG GAA 
Met Leu lie Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
580 585 590 

GGG ATA TTA GAG CAT GAT TTA ACA GAA GGG ATT GAA CTA GAA TCG CAT 
Gly lie Leu Glu His Asp Leu Thr Glu Gly lie Glu Leu Glu Ser His 
595 600 605 

GCC AGT TTT AGC GAT AAG TAT TAT TTT TAT CAA GCC GTG AGC GAA AAG 
Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
610 615 620 

CGT TGC ATT TTA ACG GAC CCC TAT CCT TCT AAA AAA GGA AAC CAT TTA 
Arg Cys lie Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
625 630 635 



m 



'A GTG AGC GCG TCT TAC CCG GTG TAT GAT CAA AAT AAC GAT CTA GCG 
1 Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
40 645 650 655 



TTT GTG GTG TGC TTG CAA ATC CCT TTG AGG GTA GCG ATT GAA ATC AGC 
Phe Val Val Cys Leu Gin lie Pro Leu Arg Val Ala He Glu He Ser 
660 665 670 

TCG CCT TCA AAG TAT TTC AGA ACC TTT AGC GAA GGG AGC ATG GTT ATG 
Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
675 680 685 

TAT TTT ATG ATT TCT ATC ATG CTC ACT TTA GTG TCG TTG CTT TTA TTT 
Tyr Phe Met He Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
690 695 700 

GTG AAA TGC ATT TCT AGC TTT TGG ACA GCG ATT GTT AAT TTT AGC AGT 
Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
705 710 715 
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TTT GAC ATT AAA GAA GTG TTC CAC CCC ATT GTG CTT TTA ACC CTA GCC 672 
Phe Asp lie Lys Glu Val Phe His Pro lie Val Leu Leu Thr Leu Ala 
720 725 730 735 

TTA GCC ACC TTT GAT CTA GTC AAG GCG ATT TTT GAA GAG GAA GTT TTG 720 
Leu Ala Thr Phe Asp Leu Val Lys Ala lie Phe Glu Glu Glu Val Leu 
740 745 750 

GGT AAA AAT AGC GGG GAC AAC CAC CAT GCG ATC CAC CGC ACG ATG ATC 768 
Gly Lys Asn Ser Gly Asp Asn His His Ala lie His Arg Thr Met lie 
755 760 765 

AGG TTT TTA GGC TCT ATC ATT ATC GCA TTA GCC ATT GAA GCG TTA ATG 816 
Arg Phe Leu Gly Ser lie lie lie Ala Leu Ala lie Glu Ala Leu Met 
770 775 780 

TTA GTG TTT AAA TTC AGC GTG AGC GAA CCG GAT AAA ATC ACT TAT GCG 864 
Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys lie Thr Tyr Ala 
785 790 795 

TG TAT TTG GCT GTT GGC GTG GCG GTG CTT TTG ATC AGT TTG GCG ATT 912 
al Tyr Leu Ala Val Gly Val Ala Val Leu Leu lie Ser Leu Ala lie 
00 805 810 815 

TAT GTC AAA TTC GCC TAT AGC GTG TTG CCC AAA CGA GAA CGC TAA 957 
Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
820 825 830 




(2) ANGABEN ZU SEQ ID NO: 22: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Met Leu Ser Arg Asp lie Val Gin Tyr Ser Lys lie Arg Thr Glu Leu 
15 10 15 

Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn He Arg Asn His Leu 
20 25 30 

ro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
35 _ 40 45 

Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
50 55 60 

Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
65 70 75 80 

Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 

85 90 95 

Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
100 105 110 

Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
115 120 125 



Val Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
130 135 140 

Phe Val Val Cys Leu Gin lie Pro Leu Arg Val Ala lie Glu lie Ser 
145 150 155 160 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
165 170 175 

Tyr Phe Met lie Ser lie Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
180 185 190 

Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
195 200 205 

Phe Asp He Lys Glu Val Phe His Pro He Val Leu Leu Thr Leu Ala 
210 215 220 



» 



Leu Ala Thr Phe Asp Leu Val Lys Ala He Phe Glu Glu Glu Val Leu 
225 230 235 240 



ly Lys Asn Ser Gly Asp Asn His His Ala He His Arg Thr Met He 
245 250 255 



Arg Phe Leu Gly Ser He He He Ala Leu Ala He Glu Ala Leu Met 
260 265 270 

Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
275 280 285 

Val Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
290 295 300 

Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 23: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 480 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS083 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..480 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

ATG CAC TCT CCA AAT TTA GAA AAA GAA GAA ACC GAA ATC ATA GAA ACA 
Met His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He He Glu Thr 
320 325 330 335 

CTC CTT ATG CGT GAA AAA ATG CGT TTA TGC CCC TTG TAT TGG CGC ATC 
Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg He 
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340 345 350 

TTA GCG TTT TTA ACC GAT GGT TTG TTA GTG GCG TTT TTA TTG AGC GAT 144 

Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
355 360 365 

CTT TTA GAC GCA TGC GAT TTC TTG CAT TCT TTA TAT TGG CTA GCT AAC 192 

Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
370 375 380 

CCT ATT TAT CAC AGC GCA TTT GTT GCG ATG GGT TTT ATC ATC TTG TAT 240 

Pro lie Tyr His Ser Ala Phe Val Ala Met Gly Phe lie lie Leu Tyr 
385 390 395 

GGC GTT TAT GAA ATC TTT TTT GTG TGT TTG TGC AAG ATG AGC TTG GCT 288 

Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 

400 405 410 415 

AAA CTG GTT TTT AGG ATT AAG ATT ATT GAT ATT TAT TTG GCA GAT TGC 336 

Lys Leu Val Phe Arg He Lys lie He Asp He Tyr Leu Ala Asp Cys 

420 425 430 

CC AGT AGG GCT ATT TTA TTG AAG CGT TTA GGG TTA AAG ATC GTG GTT 3 84 

Pro Ser Arg Ala He Leu Leu Lys Arg Leu Gly Leu Lys He Val Val 
435 440 445 

TTT CTA TGC CCC TTT TTA TGG TTT GTT GCG TTT AAA AAC CCC TAT CAT 43 2 

Phe Leu Cys Pro Phe Leu Trp Phe Val Ala Phe Lys Asn Pro Tyr His 
450 455 460 

AGG GCG TGG CAT GAA GAA AAA AGC AAA AGT CTT TTG GTA TTG TTT TAA 480 

Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe * 
465 470 475 



(2) ANGABEN ZU SEQ ID NO: 24: 

(i) SEQUENZKENNZEICHEN: 

(A) LANG E : 160 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

st His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He He Glu Thr 
1 5 10 15 

Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg He 
20 25 30 

Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
35 40 45 

Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
50 55 60 

Pro He Tyr His Ser Ala Phe Val Ala Met Gly Phe He He Leu Tyr 
65 70 75 80 



Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 

85 90 95 



Lys Leu Val Phe Arg 
100 

Pro Ser Arg Ala lie 
115 

Phe Leu Cys Pro Phe 
130 

Arg Ala Trp His Glu 
145 



lie Lys lie lie Asp 
105 



Leu Leu Lys Arg Leu 
120 

Leu Trp Phe Val Ala 
135 

Glu Lys Ser Lys Ser 
150 



lie Tyr Leu Ala Asp Cys 
110 

Gly Leu Lys lie Val Val 
125 

Phe Lys Asn Pro Tyr His 
140 

Leu Leu Val Leu Phe * 
155 160 



(2) ANGABEN ZU SEQ ID NO: 25: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1983 Basenpaare 

(B) ART: Nucleotid 

( C ) STRANGFORM : be i de s 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS084 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1983 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

ATG ATT TAT TGG TTG TAT TTG GCG GTC TTT TTT TTG TTG AGC GCA TTA 
Met He Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
165 170 175 

GAC GCT AAA GAA ATC GCT ATG CAA CGA TTT GAC AAA CAA AAC CAT AAG 
Asp Ala Lys Glu He Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
180 185 190 

ATT TTT GAA ATC CTT GCG GAT AAA GTG AGC GCT AAA GAC AAT GTG ATA 
He Phe Glu He Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val He 
195 200 205 

CC GCA TCA GGG AAT GCG ATC TTA TTG AAT TAT GAT GTG TAT ATT CTA 
Thr Ala Ser Gly Asn Ala He Leu Leu Asn Tyr Asp Val Tyr He Leu 
210 215 220 

GCG GAC AAG GTG CGT TAT GAC ACT AAA ACC AAA GAA GCG TTA TTA GAG 
Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
225 230 235 240 

GGG AAT ATC AAG GTT TAT AGG GGC GAG GGT TTG CTC GTT AAA ACC GAT 
Gly Asn He Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
245 250 255 

TAC GTG AAA TTG AGT TTG AAT GAA AAA TAT GAA ATC ATT TTC CCC TTT 
Tyr Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu He He Phe Pro Phe 
260 265 270 



TAT GTC CAA GAC AGC GTG AGC GGG ATT TGG GTG AGC GCG GAT ATT GCC 




33 

Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
275 280 285 

AGC GGA AAG GAT CAA AAA TAT AAG GTT AAA AAC ATG AGC ACT TCA GGG 432 
Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
290 295 300 

TGC AGC ATT GAT AAC CCC ATT TGG CAT GTC AAT GCG ACT TCA GGC TCA 480 
Cys Ser lie Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
305 310 315 320 

TTC AAC ATG CAA AAA TCG CAT TTG TCT ATG TGG AAT CCT AAG ATC TAT 52 8 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
325 330 335 

GTC GGT GAT ATT CCT GTA TTG TAT TTG CCC TAT ATT TTC ATG TCC ACG 576 
Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
340 345 350 

AGC AAT AAA AGA ACT ACT GGG TTT TTA TAC CCT GAG TTT GGC ACT TCC 624 
er Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
355 360 365 

AAC TTA GAC GGC TTT ATT TAT TTG CAA CCC TTT TAT TTA GCC CCC AAA 672 
Asn Leu Asp Gly Phe He Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
370 375 380 

AAC TCA TGG GAT ATG ACC TTT ACC CCA CAA ATC CGC TAT AAA AGG GGT 720 
Asn Ser Trp Asp Met Thr Phe Thr Pro Gin He Arg Tyr Lys Arg Gly 
385 390 395 400 

TTT GGC TTG AAT TTT GAA GCG CGC TAC ATT AAC TCT AAA AAC GAC AGG 768 
Phe Gly Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asn Asp Arg 
405 410 415 

TTT TTA TTC AAC GCG CGC TAT TTT AGG AAT TAC ACC CAA TAT GTC AAA 816 
Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
420 425 430 

CGC TAC GAT TTG AGG AAT CAA AAT ATC TAC GGG TTT GAA TTT TTA AGC 864 
Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe Leu Ser 
435 440 445 

CT AGC AGG GAC ACT TTA CAA AAA TAC TTC CAC CTT AAG TCT AAT ATT 912 
er Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
450 455 460 

GAC AAC GGG CAT TAC ATT GAC TTT TTA TAC ATG AAC GAT TTG GAC TAT 960 
Asp Asn Gly His Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
465 470 475 480 

GTG CGT TTT GAA AAG GTT AAT AAG CGT ATC ACA GAC GCC ACG CAC ATG 100 8 

Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
485 490 495 

TCT AGG GCG AAT TAC TAT TTG CAA ACA GAA AAC AAT TAT TAC GGC TTG 1056 
Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
500 505 510 

AAT ATC AAG TAT TTT TTA AAC CTG AAT AAA ATC AAC AAT AAC CGC ACT 1104 
Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
515 520 525 
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TTC CAA TCT GTC CCT AAT TTG CAA TAC CAT AAA TAT TTA AAT TCT TTG 1152 
Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
530 535 540 

TAT TTT AGA AAT TTG TTG TAT TCG GTG GAT TAT CAG TTT AGA AAC ACC 1200 
Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
545 550 555 560 

GCA AGA GAG ATT GGT TAT GGC TAT GTG CAA AAC GCT TTG AAT GTG CCG 1248 
Ala Arg Glu He Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
565 570 575 

GTG GGC TTG CAA TTT TCT TTG TTT AAA AAG TAT TTG TCT TTA GGG CTT 1296 
Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
580 585 590 

TGG AAT GAT CTC CAA CTA TCT AAT GTG GCT TTA ATG CAA TCT AAA AAT 1344 
Trp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
595 600 605 

•CC TTC GTG CCT ACG ATC CCT AAT GAA TCA AGG GAA TTT GGG AAT TTT 1392 
er Phe Val Pro Thr He Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
610 615 620 

GTG TCT TCA AAT TTT TCC ATG TAT GTC AAT ACG GAT TTG GCT AGA GAA 1440 
Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
625 630 635 640 

TAC AAC AAG CTT TTC CAC ACG ATC CAA CTA GAA GCG ATT TTC AAC ATC 1488 
Tvr Asn Lys Leu Phe His Thr He Gin Leu Glu Ala He Phe Asn He 
* 645 650 655 

CCT TAT TAC ACC TTT AAA AAC GGC TTA TTT TCT CAA AAC ATG TAT GCT 1536 
Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
660 665 670 

TTA AGC GCG CAA GCC TTA AAC AGC TAC ACT TCG CCT TTA TTG AGA GAT 1584 
Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
675 680 685 

TAT GAT TAT CAA GGG CGT TTG TAT GAC TCG GTG TGG AAT CCT AGC AGT 1632 
Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
690 695 700 



,xT TTA CCT AGC AAT GCG AGC AAC AAG ACG GTG GAT TTA ACC CTA ACG 1680 
le Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
705 710 715 720 

CAA TAC CTT TAT GGC TTA GGG GGG CAA GAG TTA TTG TAT TTT AAA ATA 1728 
Gin Tvr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys He 
725 730 735 

TCG CAA CTC ATC AAT CTT GAC GAT AAA GTT TCG CCC TTT AGA ATG CCA 1776 
Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
740 745 750 

CTA GAG AGC AAG ATC GGG TTT TCG CCC TTA ACG GGA TTG AAC ATC TTT 1824 
Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
755 760 765 

GGG AAT GTC TTT TAT TCG TTT TAT CAA AAC CGC TTA GAA GAA ATC TCT 1872 
Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
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770 775 780 

GTG AAC GCC AAT TAC CAA CGC AAG TTT TTA AGC TTT AAC CTC TCT TAT 1920 
Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
785 790 795 800 

TTT TTA AAA AAC AAT TTT AGC AGT GGG ATT AAT AGC ATT GTA GAA AAT 1968 
Phe Leu Lys Asn Asn Phe Ser Ser Gly lie Asn Ser lie Val Glu Asn 
805 810 815 

CTG CGG ATT ATT TAA 1983 
Leu Arg lie lie * 
820 

(2) ANGABEN ZU SEQ ID NO: 26: 

( i ) S E QUENZ KENNZE I CHEN : 

(A) LANGE: 661 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Met lie Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
15 10 15 

Asp Ala Lys Glu lie Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
20 25 30 

lie Phe Glu lie Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val lie 
35 40 45 

Thr Ala Ser Gly Asn Ala lie Leu Leu Asn Tyr Asp Val Tyr lie Leu 
50 55 60 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
65 70 75 80 

Gly Asn lie Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
85 90 95 



r Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu lie lie Phe Pro Phe 
100 105 110 



Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
115 " 120 125 

Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
130 135 140 

Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
145 150 155 160 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
165 170 175 

Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
180 185 190 

Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 




195 200 205 

Asn Leu Asp Gly Phe lie Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
210 215 220 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin lie Arg Tyr Lys Arg Gly 
225 230 235 240 

Phe Gly Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asn Asp Arg 
245 250 255 

Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
260 265 270 

Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe Leu Ser 
275 280 285 

Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
290 295 300 

sp Asn Gly His Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
05 310 315 320 

Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
325 330 335 

Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
340 345 350 

Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
355 360 365 

Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
370 375 380 

Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
385 390 395 400 

Ala Arg Glu He Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
405 410 415 

Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
420 425 430 



• 



Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
435 440 445 



Ser Phe Val Pro Thr He Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
450 455 460 

Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
465 470 475 480 

Tyr Asn Lys Leu Phe His Thr He Gin Leu Glu Ala He Phe Asn He 
485 490 495 

Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
500 505 510 

Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
515 520 525 
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Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
530 535 540 

lie Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
545 550 555 560 

Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys lie 
565 570 575 

Ser Gin Leu lie Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
580 585 590. 

Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
595 600 605 

Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
610 615 620 

Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
625 630 635 640 

he Leu Lys Asn Asn Phe Ser Ser Gly He Asn Ser He Val Glu Asn 
645 650 655 

Leu Arg He He * 
660 

(2) ANGABEN ZU SEQ ID NO: 27: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 372 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC085 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..372 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 27: 

ATG CGT TTG TTT ATC TCA CTA GTT TTG TTT TGG TGG TGG TTA AGT TTG 48 
Met Arg Leu Phe He Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
665 670 675 

AAC GCT AAA GAA GCG GAT TTC ATC TCT GAT TTG GAA TAC GGG ATG GCT 96 
Asn Ala Lys Glu Ala Asp Phe He Ser Asp Leu Glu Tyr Gly Met Ala 
680 685 690 

CTT TAT AAA AAC CCT AGG GGT GTT GCG TGC GCG AAA TGC CAT GGC ATT 144 
Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly He 
695 700 705 

AAA GGC GAA CAA CAA GAA ATC ACT TTT TAT TAT GAA AAA GGC GAA AAA 192 
Lys Gly Glu Gin Gin Glu He Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
710 715 720 725 
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AAA ATC CTC TAC GCC CCT AAA ATC AAC CAT TTA GAT TTT AAA ACC TTT 
Lys lie Leu Tyr Ala Pro Lys lie Asn His Leu Asp Phe Lys Thr Phe 
730 735 740 

AAA GAC GCC CTG AGT TTA GGC AAA GGC ATG ATG CCT AAA TAC AAT CTC 
Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
745 750 755 

AAT TTA GAA GAA ATC CAA GCG ATT TAC CTT TAC ATC ACC TCT TTA GAG 
Asn Leu Glu Glu lie Gin Ala lie Tyr Leu Tyr lie Thr Ser Leu Glu 
760 765 770 

CAT AAA GAC GAG CAT AAG AAT CCT TCC AAG CCT TAA 
His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
775 780 785 



(2) ANGABEN ZU SEQ ID NO: 28: 

(i) S E QUENZ KENN ZEI CHEN : 

(A) LANGE: 124 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 28: 

Met Arg Leu Phe lie Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
1 5 10 15 

Asn Ala Lys Glu Ala Asp Phe lie Ser Asp Leu Glu Tyr Gly Met Ala 
20 25 30 

Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly lie 
35 40 45 

Lys Gly Glu Gin Gin Glu lie Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
50 55 60 

Lys lie Leu Tyr Ala Pro Lys lie Asn His Leu Asp Phe Lys Thr Phe 
65 70 75 80 



ys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
85 90 95 



sn Leu Glu Glu lie Gin Ala lie Tyr Leu Tyr lie Thr Ser Leu Glu 
100 _ 105 110 

His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
115 120 

(2) ANGABEN ZU SEQ ID NO: 29: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 558 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

( D ) TOPOLOGIE : 1 inear 



(vii) UNMITTELBARE HERKUNFT: 
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(B) CLON(E) : HPC090 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..558 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

ATG CGT TGG TGG TGT TTT TTG GTG TGT TGT TTT GGT ATT TTA AGC GTG 4 8 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly lie Leu Ser Val 
125 130 135 140 

ATG GAC GCT CAA AAA ACA GAC AAT AAA GGT TTG AAA AAA GAA AGA GAA 96 
Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
145 150 155 



CTT TTA GAA ATT ACT GGC AAC CAA TTT GTA GCG AAC GAC AAA ACC AAA 144 
Leu Leu Glu lie Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
160 165 170 



CC GCC GTT ATT CAA GGC AAT GTG CAG ATC AAA AAA GGT AAA GAC CGG 192 
hr Ala Val lie Gin Gly Asn Val Gin lie Lys Lys Gly Lys Asp Arg 
175 180 185 



TTG TTT GCG GAT AAG GTG AGC GTG TTT TTA AAC GAT AAA CGA AAG CCA 240 
Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
190 195 200 

GAG CGC TAT GAA GCC ACA GGG AAC ACG CAT TTT AAC ATC TTT ACA GAG 288 
Glu Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
205 210 215 220 

GAC AAT CGT GAA ATC AGC GGG AGC GCT GAC AAG CTC ATT TAT AAC GCA 336 
Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
225 230 235 

TTG AAT GGG GAA TAC AAA TTA TTG CAA AAT GCG GTG GTT AGA GAA GTG 384 
Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
240 245 250 



GGG AAA TCT AAT GTC ATC ACT GGC GAT GAA ATC ATT TTA AAC AAA ACT 432 
Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
255 260 265 



__,G GGT TAT GCT GAT GTG TTA GGG AGC GCG AAA CGG CCC GCT AAA TTC 480 

Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 

270 275 280 

GTG TTT GAT ATG GAA GAT ATT AAT GAA GAA AAT CGT AAG GCT AAA TTG 528 

Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
285 290 295 300 

AAG AAG AAA GGC ACT AAG GAA AAA CCA TGA 558 

Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
305 310 



(2) ANGABEN ZU SEQ ID NO: 30: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 186 Aminosauren 
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(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly He Leu Ser Val 
X 5 10 ^ 

Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
20 25 30 

Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 

40 45 
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Thr Ala Val He Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Arg 
50 55 60 

Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
65 70 75 80 

lu Arq Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
* 90 95 



85 




Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
100 105 HO 

Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
115 120 125 

Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
130 135 140 

Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
145 150 155 160 

Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
165 170 175 

Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
180 185 



(2) ANGABEN ZU SEQ ID NO: 31: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 768 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM": beides 

( D ) TOPOLOGIE : 1 inear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS104 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..768 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 
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ATG GAT ATT TAT GCG TTA TAT ATA GCG ATA GGG CTT TTT ACT GGC ATT 4 8 

Met Asp lie Tyr Ala Leu Tyr lie Ala lie Gly Leu Phe Thr Gly lie 
190 195 200 

CTA TCA GGG ATT TTT GGC ATT GGT GGG GGG TTG ATC ATT GTC CCT ATC 96 
Leu Ser Gly lie Phe Gly lie Gly Gly Gly Leu He He Val Pro He 
205 210 215 

ATG CTC GCA ACC GGG CAT TCT TTT GAA GAA TCC ATT GGG ATT TCC ATT 144 
Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
220 225 230 

TTG CAA ATG GCG CTT TCA TCG TTC GTG GGC TCT GTT TTG AAT TTC AAA 192 
Leu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
235 240 245 250 

AAA AAA TCG CTT GAT TTT TCT TTA GGC TTG TTG ATA GGG GCA GGG GGG 240 
Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
255 260 265 

TG ATA GGG GCG AGT TTT AGC GGA TTT GTT TTA AAA ATC GTT TCC AGT 2 88 

eu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
270 275 280 

AAA ATT TTA ATG GTT ATT TTC GCG CTT TTA GTC GTG TAT TCT ATG ATC 336 
Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
285 290 295 

CAA TTT GTT TTG AAA CCC AAA AAA AAA GAT TTG ATA GCG GAT ACT AAA 3 84 

Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
300 305 310 

CGC TAT CAT CTG CAA GGT TTG AAA TTA TTT TTA ATT GGC ACG CTC ACA 432 
Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
315 320 325 330 

GGG TTT TTT GCT ATC ACT TTA GGG ATT GGT GGG GGG ATG CTC ATG GTG 4 80 

Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
335 340 345 



CCT TTG ATG CAT TAT TTT TTA GGG TAT GAT TCT AAA AAA TGC GTG GCT 528 
Pro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
350 355 360 



'A GGG TTA TTT TTC ATC TTG TTT TCT TCT ATT TCA GGA GCT TTT TCT 576 
eu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
365 _ 370 375 

TTA ATG TAT CAC CAC ATC ATC AAT AAA GAA GTG CTC TTA GCA GGG GCG 624 
Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
380 385 390 

ATT GTG GGA TTA GGA TCT GTT ATG GGC GTG AGC ATT GGG ATT AAA TGG 672 
He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
395 400 405 410 

ATC ATG GGG CTT TTG AAT GAA AAA ATG CAT AAA GCT TTG ATT TTA GGG 720 
He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
415 420 425 

GTG TAT GGT TTG TCG CTA TTG ATT GTT TTA TAC AAA CTC TTT TTT TAA 768 
Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
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430 



435 



440 



(2) ANGABEN ZU SEQ ID NO: 32: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 256 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Met Asp lie Tyr Ala Leu Tyr He Ala He Gly Leu Phe Thr Gly He 
15 10 15 

Leu Ser Gly He Phe Gly He Gly Gly Gly Leu He He Val Pro He 
20 . 25 30 

Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
35 40 45 

eu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
50 55 60 

Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
65 70 75 80 

Leu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
85 90 95 

Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
100 105 110 

Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
115 120 125 

Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
130 135 140 

Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
145 150 155 160 

^ro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 



Leu Gly Leu Phe Phe He Leu Phe Ser Ser lie Ser Gly Ala Phe Ser 
180 " 185 190 

Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
195 200 205 

He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 

210 215 220 

He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 

225 230 235 240 

Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 




165 



170 



175 



245 



250 



255 



(2) ANGABEN ZU SEQ ID NO: 33: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 2367 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS115 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..2367 




(xi) SEQXJENZBESCHREIBUNG: SEQ ID NO: 33: 

TG AAA TGT TCG CAT TGC CAG TTG GAG TTT AAA GAA AGT GAG CTT TTT 
et Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
260 265 270 

AAA GAG GTG ATC AAT CAT AAA GAA TTG CAT TTT TGC TGC ACG GGG TGC 
Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
275 280 285 

GCT AGG GTG TAT GCG TTA TTG TTA GAT TTG AAT TTA GAG AGC TTT TAT 
Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
290 295 300 

GAC AAA TTA AAC GAT TCC ACT TTA GCC CCC GTA ACG CCC CAA GAT TCA 
Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
305 310 315 320 

ATG AGC GCT TTG GAA TTA GAA CAA GCC CTT GAA GAA AAC AAT AAG GGC 
Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
325 330 335 



•TV 
ei 



GAT TTT ATC CTT AAT CTT TTG TTA GAA AAA ACG CAT TGT AAC GCT TGC 
Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 
340 345 350 



'G TGG CTC AAT CAA AAG GTT TTA GAA CGT TTA AGT GGG GTT AAA AAA 
eu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
355 _ 360 365 

GTG AGC GTG AAT TTC ACC ACC CAC CAC TTG CAA ATC GTG TTT GAG AAG 
Val Ser Val Asn Phe Thr Thr His His Leu Gin lie Val Phe Glu Lys 
370 375 380 

TCC TTA AAC CCT AAA GAG ATT ATT CAA AAA ATT GAG AGT TTG GGC TAT 
Ser Leu Asn Pro Lys Glu lie lie Gin Lys lie Glu Ser Leu Gly Tyr 
385 390 395 400 

GGG GCT AAA ATT TAT AAT GCG CAA AAT TAC ACC CTA AAA GCG CAA AAA 
Gly Ala Lys lie Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
405 410 415 



GAA CAG CGC TCC TAC TTG CTC ACT TTG AGC GTG GGG TTT TTT GCC ACT 
Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 



420 



425 



430 




ATG AAT TTG ATG TTT ATC GCC ATT GCC AAA TAC GCA AGT TAT GGT GGC 
Met Asn Leu Met Phe lie Ala lie Ala Lys Tyr Ala Ser Tyr Gly Gly 
435 440 445 

GCA AGT TAT GGC GGT GCG AAT TAT GGC GCT GGC ATG GAT AAG CTT ATG 
Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
450 455 460 

CAA AGG AAT TTG GAT CTC GTA TCG CTC TTT TTA AGC TTG TTG GTG TTA 
Gin Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
465 470 475 480 

GTG GTT GTG GGG CGT TTT TTC ATT AAG GGG GCG TTT TAT GGG CTA AAA 
Val Val Val Gly Arg Phe Phe He Lys Gly Ala Phe Tyr Gly Leu Lys 
485 490 495 

AAT GGC GTT TTG GGC ATG GAT TTG AGC GTG TCT TTT GGA GCG TTA TCG 
Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
500 505 510 

CG TTT GTT TAT TCC GTT TAT GCC ATG TTG GTG TCC CAA GAG ACT TAT 
Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
515 520 525 

TTT GAA GCG AGC AGC ACG ATT CTA ACG CTT GTT TTT GGC TCT AAG TTT 
Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
530 535 540 

TTG GAA TTA AAA GCC AGG CTG TTT GCG AAT GAA AAA TGT CTG GCC CTA 
Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
545 550 555 560 

GAA TCG CAT GAA ATC CAT AGC GTG ATC GTT GTA GAA AAT GGC AAG CAA 
Glu Ser His Glu lie His Ser Val He Val Val Glu Asn Gly Lys Gin 
565 570 575 

ACA GAA AAA CAC CCT AAA GAT GTG GCG ATA GGC TCT GTT GTT TGG GTG 
Thr Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
580 585 590 



» 



CCA AGC GGG GCT AAA ATC GCA CTA GAT GGC GTG CTT TTA AAT AAT GCG 
ro Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
595 600 605 



AGC GTG GAT GCG TCT TTG ATC AGT GGG GAG TTT AAG CCT TTG GAA TTG 
Ser Val Asp Ala Ser Leu "He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
610 615 620 

GGG GTT AAT GAT CCA ATT TTA GGG GGT TAT GTG AAT GTG GGC GTG CCT 
Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
625 630 635 640 

TTT AGC TAT CAA GTG AGC GCT AAT TTT CAA AAC TCA CGC CTT TCT GGT 
Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
645 650 655 

TTG TTA GAA ACT TTA AAA AAG AGT TTT TTA GAA AAG CCC TTA ATT GAG 
Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu 
660 665 670 



45 



AGT AGC GCG AAT CAA ATT GCG GAT ATT TTT TCT AAA GCG GTG TTG TTT 12 96 

Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
675 680 685 

TTA GCC TTT GTA AGC TTT TTG TTA TGG CAA TTT GGT TTG GGG GGT AAT 1344 
Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
690 695 700 

TTT GAA AAA GCC TTA ATG GTG TGT ATT AGC GTG CTA GTC ATC AGC TGC 13 92 

Phe Glu Lys Ala Leu Met Val Cys He Ser Val Leu Val He Ser Cys 
705 710 715 720 

CCT TGC GCG TTC GCT CTG GCT ACG CCC ATT GCG TTA GTG ATA GGG GTG 1440 
Pro Cys Ala Phe Ala Leu Ala Thr Pro He Ala Leu Val He Gly Val 
725 730 735 

TTT AAA AAC CCT TTG ATC GTG TTT AAA GAA GCG TTG TTT TTA GAA ACT 1488 
Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
740 745 750 

TG GCT AAA GTG AAA AAA ATC TTT ATA GAC AAA ACC GGC ACG CTC ACG 1536 
eu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
755 760 765 

CAA AAA GAA GTC CTT TTA AAA GAA AAA ATC ATT TAT GAA GAA TTT GAT 1584 
Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
770 775 780 

GGA AGG CTT TTG AAG AGC CTT TTA AAA GTG AGA GAG CAT TTA GCC CAT 1632 
Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
785 790 795 800 

AGC GCG ATT CTT AAA TCT CTA GAT GGC GAT GAG GTT AGT TTA GAA AAG 1680 
Ser Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
805 810 815 

ATA GAG TTT TTC GCT CAT GGT CTG AAA GCG AGC TAT CAA AAC GAA ACC 1728 
He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
820 825 830 

CTG CTA GTG GGG AGT TTG AAA TTT TTG GGA TCT ATG GGG GTG GAT ATA 1776 
Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
835 840 845 



CA ATG AAA GAG AGC GCT AAT ATC ATG GTA GGC TTT GCG AAA AAT GAG 1824 
ro Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
850 855 860 

ACT TTA TGC GCG TTA TTC ATT TTA GAA GAG CGT TTG AAA GCT AAC GCT 1872 
Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
865 870 875 880 

AAA GAA GTC GTT CAG GCT TTA CAA AAT AAA GGC TTA GAA TTA GAG ATT 1920 
Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
885 890 895 

TTA AGC GGG GAT AAT GAA AGC TCG GTT AAG GAG TGC GCG AAA AAA TTA 1968 
Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
900 905 910 

GGG ATT TCT AAT TAT CAT GCC CAT TTG ACC CCT GAA GAT AAG GCT CAA 2 016 

Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 



915 



920 



925 




ACC ATC AGC TCT TAT AAG GGC GTT TGC GCG ATG GTA GGC GAT GGC AAT 
Thr lie Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
930 935 940 

AAT GAT GCG TTA GCC TTA AAA CAA GCG AGC GTT TCT TTA GGG TTT GAA 
Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
945 950 955 960 

AAA AGC GCT TTG AGT AAA AGC GCA TGC GAT ATT TTG CTT TTA GAA GAG 
Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp lie Leu Leu Leu' Glu Glu 
965 970 975 

GAT TTG AGT TTG CTA AAA AAA GCG TTT GAT AAC GCT CAA AAA GTC TAT 
Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
980 985 990 

CAA GTG GTG TTG CAA AAC ATT GTT TTG AGC TTG ATT TAT AAC GCT ATT 
Gin Val Val Leu Gin Asn lie Val Leu Ser Leu He Tyr Asn Ala He 
995 1000 1005 

TA ATC CCG GTC GCT ATG CTA GGA TAC ATT AAC CCT TTA ATA GCG AGT 
Leu He Pro Val Ala Met Leu Gly Tyr He Asn Pro Leu He Ala Ser 
1010 1015 1020 

TTG AGC ATG AGC GCT AGC TCA CTC TTA GTG GTC TTA AAT TCT TTG AGG 
Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
1025 1030 1035 1040 

TTG AAA CGC TCT TAA 
Leu Lys Arg Ser * 

1045 



(2) ANGABEN ZU SEQ ID NO: 34: 



( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 789 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 



et Lys Cys Ser 
1 

Lys Glu Val He 
20 

Ala Arg Val Tyr 
35 

Asp Lys Leu Asn 
50 

Met Ser Ala Leu 
65 

Asp Phe He Leu 



His Cys Gin Leu 
5 

Asn His Lys Glu 



Ala Leu Leu Leu 
40 

Asp Ser Thr Leu 
55 

Glu Leu Glu Gin 
70 



Asn Leu Leu Leu 
85 



Glu Phe Lys Glu 
10 

Leu His Phe Cys 
25 

Asp Leu Asn Leu 



Ala Pro Val Thr 
60 

Ala Leu Glu Glu 
75 

Glu Lys Thr His 
90 



Ser Glu Leu Phe 
15 

Cys Thr Gly Cys 
30 

Glu Ser Phe Tyr 
45 

Pro Gin Asp Ser 



Asn Asn Lys Gly 
80 

Cys Asn Ala Cys 
95 



47 



Leu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
100 105 110 

Val Ser Val Asn Phe Thr Thr His His Leu Gin lie Val Phe Glu Lys 
115 120 125 

Ser Leu Asn Pro Lys Glu lie lie Gin Lys lie Glu Ser Leu Gly Tyr 
130 135 140 

Gly Ala Lys lie Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
145 150 155 160 

Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 
165 170 175 

Met Asn Leu Met Phe He Ala He Ala Lys Tyr Ala Ser Tyr Gly Gly 
180 185 190 

Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
195 200 205 

In Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
210 215 220 

Val Val Val Gly Arg Phe Phe He Lys Gly Ala Phe Tyr Gly Leu Lys 
225 230 235 240 

Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
245 250 255 

Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
260 265 270 

Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
275 280 285 

Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
290 295 300 

Glu Ser His Glu He His Ser Val He Val Val Glu Asn Gly Lys Gin 
305 310 315 320 



Thr Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
325 330 335 



ro Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
340 345 350 

Ser Val Asp Ala Ser Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
355 360 365 

Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
370 375 380 

Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
385 390 395 400 

Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu 
405 410 415 

Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
420 425 430 



48 



Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
435 440 445 

Phe Glu Lys Ala Leu Met Val Cys lie Ser Val Leu Val lie Ser Cys 
450 455 460 

Pro Cys Ala Phe Ala Leu Ala Thr Pro lie Ala Leu Val lie Gly Val 
465 470 475 480 

Phe Lys Asn Pro Leu lie Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
485 490 495 

Leu Ala Lys Val Lys Lys lie Phe lie Asp Lys Thr Gly Thr Leu Thr 
500 505 510 

Gin Lys Glu Val Leu Leu Lys Glu Lys lie lie Tyr Glu Glu Phe Asp 
515 520 525 

Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
530 535 540 

er Ala lie Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
45 550 555 560 

lie Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
565 570 575 

Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp lie 
580 585 590 

Pro Met Lys Glu Ser Ala Asn lie Met Val Gly Phe Ala Lys Asn Glu 
595 600 605 

Thr Leu Cys Ala Leu Phe lie Leu Glu Glu Arg Leu Lys Ala Asn Ala 
610 615 620 

Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu lie 
625 630 635 640 

Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
645 650 655 



Gly lie Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
660 665 670 



hr lie Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 

675 680 685 

Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 

690 695 700 

Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp lie Leu Leu Leu Glu Glu 

705 710 715 720 

Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 

725 730 735 

Gin Val Val Leu Gin Asn lie Val Leu Ser Leu lie Tyr Asn Ala lie 

740 745 750 

Leu lie Pro Val Ala Met Leu Gly Tyr lie Asn Pro Leu lie Ala Ser 

755 760 765 



Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
770 775 780 



Leu Lys Arg Ser * 
785 

(2) ANGABEN ZU SEQ ID NO: 35: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2751 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 




(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON(E) : HPS120 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2751 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 




ATT AAA AAA TTA ATT CTA TCC TCT CTT GTT TTC GCA TGT ATC AAT ACC 
lie Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
790 795 800 805 

AGC GTT GAA GCT TTA GAA AAT GAC GGC TCT AAA CCA AAC GAT TTG ACT 
Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
810 815 820 

TCT CCA AAA GAA GCC TCT CAA GAA TCT CAA AAA AAT GAA GCT CCA AAA 
Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
825 830 835 

AAT GAA GTT CAA AGA AAT GAA GCT CAA AAA GAA ACC CCC CAA TCC AAT 
Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
840 845 850 

CAA ACG CCT AAA GAA ATG AAA GTC AAG TCC ATT TCT TAT GTC GGG CTT 
pin Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
855 860 865 

TCT TAC ATG TCT GAC ATG CTC GCT AAT GAA ATT GTA AAG ATT CGT GTG 
Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
870 875 880 885 

GGC GAT ATT GTG GAT TCT AAA AAA ATA GAC ACC GCT GTT TTG GCT TTG 
Gly Asp lie Val Asp Ser Lys Lys lie Asp Thr Ala Val Leu Ala Leu 
890 895 900 

TTC AAT CAA GGG TAT TTT AAA GAC GTT TAT GCC ACT TTT GAA GGC GGC 
Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
905 910 915 

ATA TTA GAG TTT CAT TTT GAT GAA AAA GCC AGG ATT GCC GGG GTA GAA 
lie Leu Glu Phe His Phe Asp Glu Lys Ala Arg lie Ala Gly Val Glu 
920 925 930 



50 



ATC AAG GGT TAT GGG ACT GAA AAG GAA AAA GAC GGC TTA AAA TCC CAA 
lie Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
935 940 945 

ATG GGG ATC AAA AAG GGC GAC ACC TTT GAT GAG CAA AAA TTA GAG CAT 
Met Gly lie Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
950 955 960 965 

GCT AAA ACG GCT TTA AAA ACC GCT TTA GAG GGG CAG GGC TAT TAT GGG 
Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
970 975 980 

AGC GTG GTG GAG GTG CGC ACA GAA AAG GTC AGT GAG GGT GCA TTA TTG 
Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
985 990 995 

ATC GTG TTT GAT GTG AAT AGG GGG GAT AGC ATT TAT ATC AAA CAA TCC 
lie Val Phe Asp Val Asn Arg Gly Asp Ser lie Tyr lie Lys Gin Ser 
1000 1005 1010 



» 



TT TAT GAG GGA AGC GCG AAA TTA AAA CGC CGC ATG ATT GAA TCT TTG 
le Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
1015 1020 1025 



AGT GCG AAC AAG CAA CGA GAT TTC ATG GGC TGG ATG TGG GGC TTG AAT 
Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
1030 1035 1040 1045 

GAC GGG AAA TTG CGT TTA GAT CAA CTA GAA TAC GAT TCT ATG CGT ATC 
Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
1050 1055 1060 

CAA GAT GTG TAT ATG CGT AGG GGT TAC TTA GAC GCT CAT ATT TCT TCG 
Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His lie Ser Ser 
1065 1070 1075 

CCT TTT TTG AAA ACG GAT TTT TCT ACC CAT GAC GCT AAG CTT CAT TAT 
Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
1080 1085 1090 

AAA GTC AAA GAG GGG ATC CAA TAC AGG ATT TCA GAC ATT TTA ATA GAG 
Lys Val Lys Glu Gly lie Gin Tyr Arg lie Ser Asp lie Leu lie Glu 
1095 1100 1105 



TT GAC AAC CCG GTA GTC CCC TTA AAA ACC TTA GAA AAA GCG CTT AAA 
le Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
1110 1115 1120 1125 

GTG AAA AGG AAA GAT GTC TTT AAT ATT GAG CAT TTA AGA GCG GAT GCG 
Val Lys Arg Lys Asp Val Phe Asn lie Glu His Leu Arg Ala Asp Ala 
1130 1135 1140 

CAA ATT TTA AAA ACC GAA ATC GCC GAT AAG GGT TAT GCG TTT GCG GTG 
Gin lie Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
1145 1150 1155 

GTG AAG CCA GAC TTG GAT AAA GAT GAA AAA AAC GGG CTT GTG AAA GTC 
Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
1160 1165 1170 



ATT TAT CGT ATT GAA GTG GGC GAT ATG GTG TAT ATC AAT GAT GTC ATC 
He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 



1175 



1180 



1185 



ATT TCA GGG AAC CAG CGC ACG AGC GAT AGG ATC ATT AGA AGG GAG TTA 
lie Ser Gly Asn Gin Arg Thr Ser Asp Arg lie lie Arg Arg Glu Leu 
1190 1195 1200 1205 

TTG TTA GGG CCT AAG GAT AAA TAC AAC TTG ACC AAA CTG AGA AAT TCC 
Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
1210 1215 1220 

GAA AAT TCT TTA AGG CGT TTA GGA TTC TTC TCT AAA GTC AAA ATT GAA 
Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys lie Glu 
1225 1230 1235 

GAA AAA AGG GTT AAT AGC TCA CTC ATG GAT TTA TTA GTG AGC GTA GAA 
Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
1240 1245 1250 



GAG GGG CGT ACT GGG CAG TTG CAA TTT GGG TTA GGC TAT GGC TCT TAT 
Glu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
1255 1260 1265 



[A GGG CTT ATG CTT AAT GGG AGC GTG AGC GAA AGA AAC CTT TTT GGC 
Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
1270 1275 1280 1285 

ACA GGG CAA AGC ATG AGC TTG TAT GCT AAC ATC GCT ACA GGG GGG GGT 
Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn lie Ala Thr Gly Gly Gly 
1290 1295 1300 

AGA TCT TAT CCG GGC ATG CCA AAA GGA GCG GGG CGT ATG TTT GCC GGG 
Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
1305 1310 1315 

AAT TTG AGC TTG ACT AAT CCA AGG ATT TTT GAC AGC TGG TAT AGC TCT 
Asn Leu Ser Leu Thr Asn Pro Arg lie Phe Asp Ser Trp Tyr Ser Ser 
1320 1325 1330 

ACG ATC AAC CTT TAT GCG GAT TAC AGG ATA AGC TAC CAA TAC ATC CAA 
Thr lie Asn Leu Tyr Ala Asp Tyr Arg lie Ser Tyr Gin Tyr lie Gin 
1335 1340 1345 



» 



CAA GGC GGG GGC TTT GGG GTG AAT GTC GGG CGC ATG CTG GGT AAT AGA 
Gin Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
350 1355 1360 1365 



ACC CAT GTG AGC TTA GGG TAT AAC TTG AAT GTT ACC AAA CTC CTT GGT 
Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
1370 1375 1380 

TTC AGC AGC CCT TTA TAC AAC CGC TAC TAT TCC TCT GTT AAT GAA GTG 
Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
1385 1390 1395 

GTT TCT CCA AGG CAA TGT TCT ACC CCC GCA TCG GTG ATT ATC AAT CGC 
Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val lie lie Asn Arg 
1400 1405 1410 

TTA TCA GGC GGT AAA ACC CCC TTA CAA CCT GAA AGC TGT TCT AGT CCT 
Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
1415 1420 1425 



52 



GGA GCG ATC ACC ACT TCA CCA GAA ATA AGA GGT ATT TGG GAT AGG GAT 
Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
1430 1435 1440 1445 

TAC CAT ACG CCT ATC ACC AGC TCT TTC ACC CTT GAT GTG AGC TAT GAC 
Tyr His Thr Pro lie Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
1450 1455 1460 

AAC ACC GAT GAT TAT TAC TTC CCT AGA AAT GGG GTT ATC TTT AGT TCC 
Asn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val lie Phe Ser Ser 
1465 1470 1475 

TAT GCG ACG ATG TCT GGC TTG CCA AGC TCT GGC ACG CTC AAT TCT TGG 
Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
1480 1485 1490 

AAC GGG TTA GGC GGG AAT GTC CGT AAC ACC AAA GTT TAT GGT AAA TTC 
Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
1495 1500 1505 



CC GCT TAC CAC CAT TTG CAA AAA TAT TTA TTG ATA GAT TTG ATC GCT 
a Ala Tyr His His Leu Gin Lys Tyr Leu Leu lie Asp Leu lie Ala 
510 1515 1520 1525 



CGC TTT AAA ACG CAA GGA GGT TAT ATC TTT AGG TAT AAC ACC GAT GAT 
Arg Phe Lys Thr Gin Gly Gly Tyr lie Phe Arg Tyr Asn Thr Asp Asp 
1530 1535 1540 

TAC TTG CCC TTA AAC TCC ACC TTC TAC ATG GGG GGC GTA ACC ACG GTG 
Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
1545 1550 1555 

AGA GGC TTT AGG AAC GGA TCG GTT ACT CCT AAA GAT GAG TTT GGC TTG 
Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
1560 1565 1570 

TGG CTT GGA GGC GAT GGG ATT TTT ACC GCT TCT ACT GAA TTG AGC TAT 
Trp Leu Gly Gly Asp Gly lie Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
1575 1580 1585 

GGG GTG CTA AAG GCG GCT AAA ATG CGC TTA GCG TGG TTT TTT GAC TTT 
Gly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
1590 1595 1600 1605 



T TTC TTA ACC TTT AAA ACC CCA ACT AGA GGG AGT TTT TTC TAT AAC 
ly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
1610 1615 1620 



GCT CCT GTT ACG ACA GCG AAT TTT AAA GAT TAT GGC GTT ATA GGG GCT 
Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val lie Gly Ala 
1625 1630 1635 

GGG TTT GAA AGA GCG ACT TGG AGG GCT TCC ACA GGC TTG CAG ATT GAA 
Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin lie Glu 
1640 1645 1650 

TGG ATT TCG CCC ATG GGG CCT TTG GTG TTG ATT TTC CCT ATA GCG TTT 
Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
1655 1660 1665 



TTC AAC CAA TGG GGC GAT GGC AAT GGC AAG AAA TGT AAA GGG CTA TGC 
Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
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1670 1675 1680 1685 

TTC AAC CCT AAC ATG GAC GAT TAG ACG CAA CAC TTT GAA TTT TCT ATG 2736 
Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
1690 1695 1700 

GGA ACA AGG TTT TAA 2751 
Gly Thr Arg Phe * 
1705 



(2) ANGABEN ZU SEQ ID NO: 36: 

( i } SEQUENZKENNZEICHEN : 

(A) LANGE: 917 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 

le Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
15 10 15 

Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
20 25 30 

Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
35 40 45 

Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
50 55 60 

Gin Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
65 70 75 80 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
85 90 95 

Gly Asp lie Val Asp Ser Lys Lys lie Asp Thr Ala Val Leu Ala Leu 
100 105 110 

Phe Asn Gin Gly Tyr. Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
115 120 125 

le Leu Glu Phe His Phe Asp Glu Lys Ala Arg lie Ala Gly Val Glu 
130 135 140 

lie Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
145 150 155 160 

Met Gly lie Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
165 170 175 

Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
180 185 190 

Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
195 200 205 

lie Val Phe Asp Val Asn Arg Gly Asp Ser lie Tyr lie Lys Gin Ser 
210 215 220 
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lie Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
225 230 235 240 

Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
245 250 255 

Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
260 265 270 

Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His lie Ser Ser 
275 280 285 

Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
290 295 300 

Lys Val Lys Glu Gly lie Gin Tyr Arg lie Ser Asp lie Leu lie Glu 
305 310 315 320 

lie Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
325 330 335 

1 Lys Arg Lys Asp Val Phe Asn lie Glu His Leu Arg Ala Asp Ala 
340 345 350 

Gin lie Leu Lys Thr Glu lie Ala Asp Lys Gly Tyr Ala Phe Ala Val 
355 360 365 

Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
370 375 380 

lie Tyr Arg lie Glu Val Gly Asp Met Val Tyr lie Asn Asp Val lie 
385 390 395 400 

lie Ser Gly Asn Gin Arg Thr Ser Asp Arg lie lie Arg Arg Glu Leu 
405 410 415 

Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
420 425 430 

Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys lie Glu 
435 440 445 

Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
450 455 460 

blu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
465 470 _ 475 480 

Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
485 490 495 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn lie Ala Thr Gly Gly Gly 
500 505 510 

Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
515 520 525 

Asn Leu Ser Leu Thr Asn Pro Arg lie Phe Asp Ser Trp Tyr Ser Ser 
530 535 540 

Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
545 550 555 560 
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Gin Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
565 570 575 

Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
580 585 590 

Phe Ser Ser Pro Leu Tyr Asn Arg Ty r Ty^ Ser Ser Va ^- Asn Glu Val 
595 600 605 

Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val lie lie Asn Arg 
610 615 620 

Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
625 630 635 640 

Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
645 650 655 

Tyr His Thr Pro lie Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
660 665 670 

sn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val lie Phe Ser Ser 
675 680 685 

Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
690 695 700 

Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
705 710 715 720 

Ala Ala Tyr His His Leu Gin Lys Tyr Leu Leu lie Asp Leu lie Ala 
725 730 735 

Arg Phe Lys Thr Gin Gly Gly Tyr lie Phe Arg Tyr Asn Thr Asp Asp 
740 745 750 

Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
755 760 765 

Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
770 775 780 

Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
85 790 795 800 

ly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
805 810 815 

Gly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
820 825 830 

Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
835 840 845 

Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
850 855 860 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
865 870 875 880 

Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
885 890 895 
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Phe Asa Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
900 905 910 

Gly Thr Arg Phe * 
915 

(2) ANGABEN ZU SEQ ID NO: 37: 

( i ) S E QUENZ KENNZE I CHEN : 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELB ARE HERKUNFT : 
(B) CLON(E) : HPS130 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

ATG AAA AGA TTT GTT TTG TTT TTA TTG TTC ATG TGC GTT TGC GTT CAA 
Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
920 925 930 

GCT TAC GCC GAG CAA GAT TAC TTT TTT AGG GAT TTT AAA TCT AGA GAT 
Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
935 940 945 

TTG CCC CAA AAA CTC CAT CTT GAT AAA AAG CTC TCC CAA ACA ATA CAG 
Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
950 955 960 965 

CCA TGC ATG CAA CTT AAC GCA TCA AAA CAC TAC ACT TCT ACC GGG GTT 
Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val- 
970 975 980 



AGA GAG CCT GAT AAA TGC ACA AAG AGT TTT AAA AAA TCC GCT CTC ATG 
g Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
985 990 995 



TCC TAT GAC TTA GCG CTA GGT TAT TTG GTG AGT AAG AAT AAG CAA TAC 
Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
1000 1005 1010 

GGC TTA AAG GCT ATA GAA ATT TTA AAC GCT TGG GCT AAA GAG CTT CAA 
Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
1015 1020 1025 

AGC GTG GAT ACT TAT CAG AGC GAG GAT AAT ATC AAT TTT TAC ATG CCT 
Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn lie Asn Phe Tyr Met Pro 
1030 1035 1040 1045 

TAT ATG AAC ATG GCT TAT TGG TTT GTC AAA AAG GCG TTT CCT AGC CCA 
Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
1050 1055 1060 



GAA TAT GAA GAT TTC ATT AAG CGG ATG CGC CAG TAT TCT CAA TCA GCT 
Glu Tyr Glu Asp Phe He Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
1065 1070 1075 

CTT AAC ACT AAC CAT GGG GCG TGG GGC ATT CTT TTT GAT GTG AGT TCT 
Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
1080 1085 1090 

GCG CTA GCG TTA GAC GAT AAT GCC CTT TTG CAC AAT AGC GCT AAT CGG 
Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
1095 1100 1105 

TGG CAG GAG TGG GTG TTT AAA GCC ATA GAT GAG AAT GGG GTT ATT GCT 
Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
1110 1115 1120 1125 

AGC GCG ATC ACT AGG AGC GAT ACG AGC GAT TAT CAT GGC GGC CCT ACA 
Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
1130 1135 1140 



G GGC ATT AAG GGG ATA GCT TAT ACC AAT TTC GCG CTT CTT GCG CTA 
ys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
1145 1150 1155 



1; 



ACC ATA TCA GGC GAA TTG CTT TTT GAG AAC GGG TAT GAT TTG TGG GGT 
Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
1160 1165 1170 

AGT GGA GCT GGG AAA AGG CTC TCT GTG GCG TAT AAC AAA GTT GCA ACA 
Ser Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
1175 1180 1185 

TGG ATT TTA AAC CCT GAA ACT TTC CCT TAT TTC CAG CCT AAC CTT ATC 
Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu lie 
H90 1195 1200 1205 

GGG GTG CAT AAC AAC GCC TAT TTC ATT ATT TTA GCC AAG CAT TAT TCT 
Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
1210 1215 1220 

AGC CCT AGT GCA AAT GAG CTT TTA AAG CAA GGC GAT TTA CAC GAA GAT 
Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
1225 1230 1235 



T TTC AGG CTG AAA CTC CGA TCG CCA TGA 
ly Phe Arg Leu Lys Leu Arg Ser Pro * 
1240 1245 



(2) ANGABEN ZU SEQ ID NO: 38: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 330 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38 



Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
1 5 10 15 
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Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 

20 25 30 

Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr He Gin 

35 40 45 

Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 

50 55 60 

Arg Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 

65 70 75 80 

Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 

85 90 95 

Gly Leu Lys Ala He Glu He Leu Asn Ala Trp Ala Lys Glu Leu Gin 

100 105 110 



Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn He Asn Phe Tyr Met Pro 
115 120 125 



r Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
130 135 140 



Glu Tyr Glu Asp Phe He Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
145 150 155 160 

Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
165 170 175 

Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
180 185 190 

Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
195 200 205 

Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
210 215 220 

Lys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
225 230 235 240 

Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
245 250 255 

er Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
260 265 270 

Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
275 280 285 

Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
290 295 300 

Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
305 310 315 320 

Gly Phe Arg Leu Lys Leu Arg Ser Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 39: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1482 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS133 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1482 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 39: 




ATG 
Met 


CAA 
Gin 


AGT 
Ser 


CTT 
Leu 


AGT 
Ser 
335 


TGG 
Trp 


CTG 
Leu 


AAT 
Asn 


TTA 
Leu 


GCG 
Ala 
340 


TTT 
Phe 


CGT 
Arg 


TGG 
Trp 


CTC 
Leu 


TTT 
Phe 
345 


ATA 
He 


48 


RcA 

Thr 


GGG 
Gly 


CTT 
Leu 


GGC 
Gly 
350 


TAT 
Tyr 


TAT 
Tyr 


ATA 
He 


ATG 
Met 


ACT 
Thr 
355 


TTA 
Leu 


TTG 
Leu 


CAA 
Gin 


TGG 
Trp 


TAT 
Tyr 
360 


CAT 
His 


TAC 
Tyr 


96 


AGC 
Ser 


GTG 
Val 


TTT 
Phe 
365 


AGG 
Arg 


ATC 
He 


TTA 
Leu 


ACC 
Thr 


AAG 
Lys 
370 


CAC 
His 


CAC 
His 


AAA 
Lys 


ATG 
Met 


CGT 
Arg 
375 


TGG 
Trp 


CAT 
His 


GGG 
Gly 


144 


ATT 
He 


TAT 
.Tyr 

yso 


TTT 
Phe 


TTA 
Leu 


TTG 
Leu 


CCT 
Pro 


TTA 
Leu 
385 


GGG 
Gly 


GTG 
Val 


TTT 
Phe 


ATT 
He 


CTG 
Leu 
390 


TCG 
Ser 


TAT 
Tyr 


GCT 
Ala 


TTC 
Phe 


192 


ACA 
Thr 
395 


ATG 
Met 


CCG 
Pro 


TTT 
Phe 


GTT 
Val 


TTT 
Phe 
400 


GAT 
Asp 


TTC 
Phe 


TTT 
Phe 


TGC 
Cys 


GGC 
Gly 
405 


GTT 
Val 


ATT 
He 


CAA 
Gin 


ATG 
Met 


CCC 
Pro 
410 


240 


ATG 
Met 


CTC 
Leu 


ATT 
He 


GTT 
Val 


TGG 
Trp 
415 


GCC 
Ala 


AAA 
Lys 


CGC 
Arg 


AAC 
Asn 


GAC 
Asp 
420 


AAG 
Lys 


CCT 
Pro 


TTA 
Leu 


GTT 
Val 


TTC 
Phe 
425 


ACG 
Thr 


288 


CCA 
^ro 


AGG 
Arg 


GTG 
Val 


AAG 
Lys 
430 


CGC 
Arg 


TTT 
Phe 


TTT 
Phe 


ATC 
He 


TTC 
Phe 
435 


TTA 
Leu 


TTA 
Leu 


TTA 
Leu 


TTT 
Phe 


TTA 
Leu 
440 


ATC 
He 


TTG 
Leu 


336 


CAT 
His 


GAA 
Glu 


ATC 
He 
445 


TTA 
Leu 


AAT 
Asn 


ATA 
He 


GAA 
Glu 


TTA 
Leu 
450 


GTC 
Val 


CCT 
Pro 


TTG 
Leu 


GAT 
Asp 


GGG 
Gly 
455 


ATT 
He 


TCG 
Ser 


CTC 
Leu 


384 


GCG 
Ala 


CTA 
Leu 
460 


GGC 
Gly 


TAT 
Tyr 


TTG 
Leu 


TGT 
Cys 


TTG 
Leu 
465 


TTT 
Phe 


ATA 
He 


TTC 
Phe 


GTT 
Val 


TTA 
Leu 
470 


AGC 
Ser 


GCT 
Ala 


TCT 
Ser 


TTA 
Leu 


432 


ATC 
He 
475 


TCT 
Ser 


GAA 
Glu 


AAA 
Lys 


GCC 
Ala 


TTA 
Leu 
480 


TCC 
Ser 


AAG 
Lys 


CAG 
Gin 


TAT 
Tyr 


TTG 
Leu 
485 


CAA 
Gin 


ACC 
Thr 


GCT 
Ala 


AAA 
Lys 


GAT 
Asp 
490 


480 


AAA 
Lys 


ATC 
He 


ACC 
Thr 


TCT 
Ser 


TTA 
Leu 
495 


AAG 
Lys 


AAT 
Asn 


TTA 
Leu 


AAA 
Lys 


GTC 
Val 
500 


ATC 
He 


GCC 
Ala 


ATT 
He 


ACC 
Thr 


GGA 
Gly 
505 


AGC 
Ser 


528 
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TTT GGG AAA ACC AGC ACC AAA AAT TTC TTG CTT CAA ATC TTA CAA ACC 

Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin He Leu Gin Thr 
510 515 520 

ACA TTC AAC GCG CAT GCA AGC CCC AAA AGC GTC AAT ACC CTT TTA GGG 
Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
525 530 535 

CTT GCG AAT GAT ATT AAT CAG AAT TTA GAC GAT AGG AGT GAA ATC TAT 
Leu Ala Asn Asp He Asn Gin Asn Leu Asp Asp Arg Ser Glu He Tyr 
540 545 550 

ATC GCT GAA GCC GGG GCA AGG AAT AAG GGC GAT ATT AAA GAA ATC ACC 
He Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
555 560 565 570 

TGT CTC ATT GAA CCG CAC CTT GTT GTG GTT GCA GAA GTG GGC GAA CAG 
Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
575 580 585 



A: 



_JT TTA GAA TAC TTT AAA ACT TTA GAA AAT ATT TGC GAG ACT AAA GCG 
is Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
590 595 600 



GAA TTA TTG GAT TCC AAA CGC TTA GAA AAA GCC TTT TGT TAC TCG GTG 
Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
605 610 615 

GAA AAG ATC AAG CCC TAT GCC CCT AAA GAT AGC CCT TTA ATA GAC TAT 
Glu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
620 625 630 

TCT AGC CTG GTT AAA AAC ATC CAA TCC ACT TTA AAA GGC ACT TCT TTT 
Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
635 640 645 650 

GAA ATG CTT ATA GGT AGC GTT TGG GAA AGA TTT GAA ACA AAG GTT CTA 
Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
655 660 665 

GGG GAG TTT AGC GCT TAT AAT ATC GCT TCA GCC ATT TTA ATC GCT AAG 
Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
670 675 680 



.T TTA GGC TTA GAG ACC GAA AGG ATC AAA CGG CTT GTT TTA GAA CTC 
is Leu Gly Leu Glu Thr Glu Arg lie Lys Arg Leu Val Leu Glu Leu 
685 690 695 

AAC CCT ATT GCT CAT CGT TTG CAA CTT TTG GAA GTG AAT CAA AAA ATC 
Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
700 705 710 

ATC ATA GAC GAT AGC TTT AAT GGG AAT TTA AAG GGC ATG TTA GAG GGC 
He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
715 720 725 730 

ATT CGT TTA GCG AGT TTG CAC AAA GGG CGT AAA GTC ATT GTA ACA CCG 
He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
735 740 745 



GGC TTA GTG GAA AGC AAT ACA GAA AGT AAT GAG GCT TTA GCG CAA AAA 
Gly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
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750 755 760 

ATA GAC GGG GTT TTT GAT GTC GCT ATC ATC ACA GGG GAG TTG AAT TCC 1344 
lie Asp Gly Val Phe Asp Val Ala lie lie Thr Gly Glu Leu Asn Ser 
765 770 775 

AAA ACG ATT GCT TCA CAA TTG AAA ACC CCC CAA AAA ATC TTA CTC AAG 1392 
Lys Thr lie Ala Ser Gin Leu Lys Thr Pro Gin Lys lie Leu Leu Lys 
780 785 790 

GAT AAG GCG CAA TTG GAA AAT ATC TTA CAA GCC ACC ACG ATT CAA GGC 144 0 

Asp Lys Ala Gin Leu Glu Asn lie Leu Gin Ala Thr Thr lie Gin Gly 
795 800 805 810 

GAT TTG ATT TTA TTC GCT AAT GAC GCC CCT AAT TAC ATT TAG 1482 
Asp Leu lie Leu Phe Ala Asn Asp Ala Pro Asn Tyr lie * 
815 820 

(2) ANGABEN ZU SEQ ID NO: 40: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 494 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 40: 

Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe lie 
15 10 15 

Thr Gly Leu Gly Tyr Tyr lie Met Thr Leu Leu Gin Trp Tyr His Tyr 
20 25 30 

Ser Val Phe Arg lie Leu Thr Lys His His Lys Met Arg Trp His Gly 
35 40 45 

lie Tyr Phe Leu Leu Pro Leu Gly Val Phe lie Leu Ser Tyr Ala Phe 
50 55 60 

Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val lie Gin Met Pro 
65 70 75 80 

et Leu lie Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
85 90 95 

Pro Arg Val Lys Arg Phe Phe lie Phe Leu Leu Leu Phe Leu lie Leu 
100 105 110 

His Glu lie Leu Asn lie Glu Leu Val Pro Leu Asp Gly lie Ser Leu 
115 120 125 

Ala Leu Gly Tyr Leu Cys Leu Phe lie Phe Val Leu Ser Ala Ser Leu 
130 135 140 

lie Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
145 150 155 160 

Lys lie Thr Ser Leu Lys Asn Leu Lys Val lie Ala lie Thr Gly Ser 
165 170 175 
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Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin lie Leu Gin Thr 
180 185 190 

Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
195 200 205 

Leu Ala Asn Asp lie Asn Gin Asn Leu Asp Asp Arg Ser Glu lie Tyr 
210 215 220 

lie Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
225 230 235 240 

Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
245 250 255 

His Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
260 265 270 

Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
275 280 285 

lu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
290 295 300 

Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
305 310 315 320 

Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
325 330 335 

Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
340 345 350 

His Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
355 360 365 

Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
370 375 380 

He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
385 390 395 400 



» 



He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
405 410 415 



ly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
420 . 425 430 

He Asp Gly Val Phe Asp Val Ala He He Thr Gly Glu Leu Asn Ser 
435 440 445 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
450 455 460 

Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
465 470 475 480 

Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
485 490 

(2) ANGABEN ZU SEQ ID NO: 41: 
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( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 600 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPC134 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..600 





(xi) SEQXJENZBESCHREIBUNG: SEQ ID NO: 41: 

ATG TCA AGC GCT CTG TTA GGC TTA CAA ATT GTT TTA GCG GTA TTG ATT 
Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu lie 
95 500 505 510 

TG GTG GTG GTT TTG TTG CAA AAA AGT TCT AGC ATC GGC TTA GGG ACT 
Val Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Thr 
515 520 525 

TAT AGC GGG AGT AAT GAG TCT TTA TTT GGC GCT AAA GGG CCC GCG TGC 
Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
530 535 540 

TTT ATG GCG AAA TTG ACC ATG TTT TTA GGG CTG TTA TTT GTT ATC AAC 
Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
545 550 555 

ACC ATC GCT TTG GGC TAT TTT TAC AAC AAA GAA TAC GGC AAA AGC ATT 
Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
560 565 570 

TTA GAT GAA ACT AAA ACC AAC AAA GAG CTT TCG CCC TTA GTC CCT GCC 
Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
575 580 585 590 

ACC GGC ACG CTC AAC CCT ACA CTC AAT CCC ACG CTC AAC CCT ACG CTC 
Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
595 600 605 

AAC CCT TTA GAG CAA GCC CCA ACT AAT CCT TTA ATG CCA AAA CAA ACG 
Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
610 615 620 

CCT AAC GAA CTC CCT AAA GAG CCA GCC AAA GCG CCT TCT GTT GAA AGC 
Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
625 630 635 

CCC AAA CAG AAT GAA AAA AAT GAA AAA AAT GAC GCC AAA GAG AAT GGT 
Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
640 645 650 



ATA AAG GGT GTT GAA AAA ACT AAA GAG AAC GCC AAA ACG CCC CCA ACC 
He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
655 660 665 670 
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ACC CAC CAA AAG CCT AAA ACG CAT GCG ACA CAA ACC AAC GCC CAT ACC 
Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
675 680 685 

AAC CAA AAA AAG GAT GAA AAA TAA 
Asn Gin Lys Lys Asp Glu Lys * 
690 




(2) ANGABEN ZU SEQ ID NO: 42: 

( i ) SEQUENZKENNZEICHEN : 

(A) IiANGE: 200 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 42: 

Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu lie 
15 10 15 

al Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Thr 
20 25 30 

Tvr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
35 40 45 

Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
50 55 60 

Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
65 70 75 80 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
85 90 95 

Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
100 105 110 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
115 120 125 

Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
130 135 140 

Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
145 150 " 155 160 

He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
165 170 175 

Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
180 185 190 

Asn Gin Lys Lys Asp Glu Lys * 
195 200 

(2) ANGABEN ZU SEQ ID NO: 43: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 153 6 Basenpaare 



(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS143 

( ix) MERKMAL : 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1536 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 



ATG 
Met 


AAA 
Lys 


AAA 
Lys 


CTT 
Leu 


CTT 
Leu 
205 


TAT 
Tyr 


ACC 
Thr 


ATA 
He 


CTC 
Leu 


GCG 
Ala 
210 


CTT 
Leu 


CTT 
Leu 


TTA 
Leu 


ATC 
He 


GGC 
Gly 
215 


CTT 
Leu 


TA 
eu 


ACA 
Thr 


ATC 
He 


TAT 
Tyr 
220 


CTC 
Leu 


ATC 
He 


CTT 
Leu 


TTT 
Phe 


ACA 
Thr 
225 


GAA 
Glu 


TGG 
Trp 


GGG AAT 
Gly Asn 


AAG 
Lys 
230 


ATC 
He 


ATC 
He 


GCT 
Ala 


TCG 
Ser 


TAT 
Tyr 
235 


ATA 
He 


GAG 
Glu 


AAA 
Lys 


AAA 
Lys 


ATC 
He 
240 


AAC 
Asn 


CCG 
Pro 


AAC 
Asn 


GAG 
Glu 


CAC 
His 
245 


TAC 
Tyr 


TTG 
Leu 


AGC 
Ser 


GTT 
Val 


AAA 
Lys 
250 


ACC 
Thr 


TTT 
Phe 


AAA 
Lys 


TTG 
Leu 


AGA 
Arg 
255 


TTC 
Phe 


AAC 
Asn 


TCT 
Ser 


TTG 
Leu 


GAT 
Asp 
260 


TTT 
Phe 


AAA 
Lys 


GCT 
Ala 


CAA 
Gin 


GCC 
Ala 
265 


AAC 
Asn 


GAT 
Asp 


GAT 
Asp 


TCC 
Ser 


ACG 
Thr 
270 


CTC 
Leu 


ATT 
He 


CTT 
Leu 


AAG 
Lys 


GGG 
Gly 
275 


GAT 
Asp 


TTT 
Phe 


TCA 
Ser 


CTT 
Leu 


TTA 
Leu 
280 


AAG 
Lys 


CAA 
Gin 


AGC 
Ser 


GTA 
Val 


AAT 
Asn 
285 


TTG 
Leu 


AAT 
Asn 


TAC 
Tyr 


CAT 
His 


ATA 
He 
290 


GAT 
Asp 


ATT 
He 


AAA 
Lys 


GAT 
Asp 


TTA 
Leu 
295 


CGC 
Arg 



TCT TTC AAA GAA TGG ATA CCC TAC CCT TTA AGG GGG GCT GTT ATC ACT 
Ser Phe Lys Glu Trp He Pro Tyr Pro Leu Arg Gly Ala Val He Thr 
300 305 310 



CT GGG AAT ATT AAA GGG CAT AGA AAA GCC CTT ATG ATT CAA GGC GTC 
JSer Gly Asn He Lys Gly His Arg Lys Ala Leu Met He Gin Gly Val 
315 320 325 



TCT AAT GTG GCT CAA 
Ser Asn Val Ala Gin 
330 

TTC AAG CTT TCT CGC 
Phe Lys Leu Ser Arg 
345 

GAT TTG CTT TAT TTA 
Asp Leu Leu Tyr Leu 
365 

TCC TTA CAG GCG GAT 
Ser Leu Gin Ala Asp 



TCC CAC ACT GCC TAC 
Ser His Thr Ala Tyr 
335 

TTA AAT TTG AAC GCA 
Leu Asn Leu Asn Ala 
350 

ATC AAT CGC CCC GCT 
He 'Asn Arg Pro Ala 
370 

TTT AAC TCT CTA AAG 
Phe Asn Ser Leu Lys 



AAT GCC CTT TTA GAT GAT 
Asn Ala Leu Leu Asp Asp 
340 

CAA GAC GCC AAT TTA GAA 
Gin Asp Ala Asn Leu Glu 
355 360 

TAT GCG AAC GCA AAA GTG 
Tyr Ala Asn Ala Lys Val 
375 

CCT TTA GAG GGG CAT TTG 
Pro Leu Glu Gly His Leu 



380 



385 



390 



ATC CTA ACA GCT AAT AAC GCT TTA ATC AAT AAC GCC CTA ATC AAT CAA 
lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
395 400 405 

ATT TTT CAT TTA AAC CTT AAA GAC ACG CTT GTT TTC AGC CTC TCG CAT 
lie Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
410 415 420 

TCA AGC GAC TTT AAA GGA AAC AAA GCC ATC AGC GAT ACC ACC CTG ACT 
Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
425 430 435 440 

AGC CCT TTA GCC AAT TTC AAA GCC CTA AAA AGC GAA TAC CTT TTC TCT 
Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
445 450 455 

ATT TTA AAA CTC AAC GCC CCC TAC ACT TTA GAA ATC CCC AAT CTA GCC 
lie Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu lie Pro Asn Leu Ala 
460 465 470 



CTC TAT AAC ATT ACC AAC CAC CCC TTA AAA GGG AGC TTG ACT TTA 
Lys Leu Tyr Asn lie Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
475 480 485 

AAA GGC GCT ATA GAA CAA AGC CCC AAA CTT TTA AAA GTC AGC GGC CAT 
Lys Gly Ala lie Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
490 495 500 

TCA AAT TTA CTA GAC GGC GCG CTG GAT TTC ACG CTT TTA AAT AAA GAT 
Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
505 510 515 520 

TTG AAA GGG CGT TTT TCC AAT ATT TCC ACT TTA AAA GCT TTA GAT TTA 
Leu Lys Gly Arg Phe Ser Asn lie Ser Thr Leu Lys Ala Leu Asp Leu 
525 530 535 

TTC CAT TAC CCT AAG TTT TTC CAA TCC GTT GCA GAC GCT AAT TTG GAT 
Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
540 545 550 



•Ty: 



TAT GAT CTT ATC GCT AAG CAA GGC GTA TTG AAA GCC CGC CTA AAA AAC 
r Asp Leu lie Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
555 560 565 



GCA AGA TTC CTC AAA AAT GCA TTC AGC GAT TTT CTC TAC TCC ATT TCT 
Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 
570 575 580 

AAA TTT GAT ATT ACA AAA GAA ATT TAT AAC GAT GCC AAT CTG GTA AGC 
Lys Phe Asp lie Thr Lys Glu He Tyr Asn Asp Ala Asn Leu Val Ser 
585 590 595 600 

CAA ATC AAC CAG CAA CGC CTG CTC TCT GAT CTG AGT TTA AAA AGC CCC 
Gin He Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
605 610 615 

AAA ACC CAA TTG AAA ATC CAT AAC GGT TTG TTG GAT TTA AAC ACC AAA 
Lys Thr Gin Leu Lys He His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
620 625 630 
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CAA ATG AAC ATG CTC ATG GAT GCG GAA ATT TTA AAA TTC ATT TTT AAA 1344 
Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe lie Phe Lys 
635 640 645 

ATG AAA CTT CAA GGC AAC ATG CAC CAG CCA AAA TTT TCT CTC ATT TTA 1392 
Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu lie Leu 
650 655 660 

AAC GAA AAA GCC ATT CAG CAA AAC TTG CAA CAA GGC TTG AAA GAA ATC 1440 
Asn Glu Lys Ala lie Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu lie 
665 670 675 680 

TTA AAA AAC GAC ACC CTT AAA AAA GGT TTA GAT CAT TTG CTT AAA GAT 1488 
Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
685 690 695 

GAT AAG CTC AAA GAA AAG CTT GAA AAA GGG CTT AAG GGG CTT TTT TAA 153 6 

Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe * 
700 705 710 

2) ANGABEN ZU SEQ ID NO: 44: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 512 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 

Met Lys Lys Leu Leu Tyr Thr lie Leu Ala Leu Leu Leu lie Gly Leu 
1 5 10 15 

Leu Thr lie Tyr Leu lie Leu Phe Thr Glu Trp Gly Asn Lys lie lie 
20 25 30 

Ala Ser Tyr lie Glu Lys Lys lie Asn Pro Asn Glu His Tyr Leu Ser 
35 40 45 

Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
50 55 60 



,1a Asn Asp Asp Ser Thr Leu lie Leu Lys Gly Asp Phe Ser Leu Leu 
65 70 75 80 



Lys Gin Ser Val Asn Leu Asn Tyr His lie Asp lie Lys Asp Leu Arg 

85 90 95 

Ser Phe Lys Glu Trp lie Pro Tyr Pro Leu Arg Gly Ala Val lie Thr 
100 105 110 

Ser Gly Asn lie Lys Gly His Arg Lys Ala Leu Met lie Gin Gly Val 
115 120 125 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
130 135 140 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
145 150 155 160 

Asp Leu Leu Tyr Leu lie Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
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165 170 175 

Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
180 185 190 

lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
195 200 205 

lie Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
210 215 220 

Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
225 230 235 240 

Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
245 250 255 

lie Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu lie Pro Asn Leu Ala 
260 265 270 

Lys Leu Tyr Asn lie Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
275 280 285 

Lys Gly Ala lie Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
290 295 300 

Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
305 310 315 320 

Leu Lys Gly ,Arg Phe Ser Asn lie Ser Thr Leu Lys Ala Leu Asp Leu 
325 330 335 

Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
340 345 350 

Tyr Asp Leu lie Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
355 360 365 

Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 
370 375 380 

Lys Phe Asp lie Thr Lys Glu lie Tyr Asn Asp Ala Asn Leu Val Ser 
385 390 395 400 

In lie Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
405 410 415 

Lys Thr Gin Leu Lys lie His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
420 425 430 

Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe lie Phe Lys 
435 440 445 

Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu lie Leu 
450 455 460 

Asn Glu Lys Ala lie Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu lie 
465 470 475 480 

Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
485 490 495 



Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe * 
500 505 510 



(2) ANGABEN ZU SEQ ID NO: 45: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 540 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS144 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .540 



» 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 

ATG AAG AGA TCT TCT GTA TTT AGT TTC TTG GTA GCT TTT TTA TTG GTA 
Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
515 520 525 

GCT GGC TGT AGT CAT AAA ATG GAT AAT AAG ACT GTG GCC GGC GAT GTG 
Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
530 535 540 

AGT GCT AAA ACG GTT CAG ACT GCA CCT GTT ACT ACA GAA CCA GCT CCA 
Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
545 550 555 560 

GAG AAA GAA GAG CCT AAA CAA GAG CCA GCT CCA GTG GTT GAA GAA AAA 
Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
565 570 575 

CCG GCT GTT GAG AGC GGG ACT ATC ATC GCT TCT ATT TAT TTT GAT TTT 
Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
580 585 590 



;AC AAG TAT GAA ATC AAA GAA TCC GAT CAA GAG ACT TTA GAT GAG ATC 
sp Lys Tyr Glu lie Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu lie 
595 600 605 



GTG CAA AAA GCT AAA GAA AAC CAC ATG CAA GTG CTT TTG GAA GGC AAT 
Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
610 615 620 

ACC GAT GAA TTT GGC TCT AGC GAA TAC AAC CAA GCG CTT GGC GTT AAA 
Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
625 630 635 640 

AGG ACT TTG AGC GTG AAA AAC GCT TTA GTC ATT AAA GGG GTA GAA AAA 
Arg Thr Leu Ser Val Lys Asn Ala Leu Val lie Lys Gly Val Glu Lys 
645 650 655 



GAT ATG ATC AAA ACC ATC AGT TTT GGT GAA ACC AAA CCC AAA TGC GCC 
Asp Met lie Lys Thr lie Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 



660 



665 



670 



GAA AAA ACT AGA GAG TGT TAT AAA GAA AAC AGA AGA GTG GAT GTC AAA 
Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
675 680 685 

TTA ATG AAG TAA 
Leu Met Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 46: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 180 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: 

et Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
1 5 10 15 

Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
20 25 30 

Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
35 40 45 

Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
50 55 60 

Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
65 70 75 80 

Asp Lys Tyr Glu lie Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu lie 
85 90 95 

Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
100 105 110 



Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
115 120 - 125 



g Thr Leu Ser Val Lys Asn Ala Leu Val lie Lys Gly Val Glu Lys 
130 135 140 

Asp Met lie Lys Thr lie Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 
145 150 155 160 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
165 170 175 

Leu Met Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 47: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1557 Basenpaare 

(B) ART: Nucleotid 



(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPC140, HPC150, HPC179 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1. .1557 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 47: 

ATG ATA AAA AAG AAT AGA ACG CTG TTT CTT AGT CTA GCC CTT TGC GCT 
Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
185 190 195 

AGC ATA AGT TAT GCC GAA GAT GAT GGA GGG TTT TTC ACC GTC GGT TAT 
er lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
200 205 210 

CAG CTC GGG CAA GTC ATG CAA GAT GTC CAA AAC CCA GGC GGC GCT AAA 
Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
215 220 225 

AGC GAC GAA CTC GCC AGA GAG CTT AAC GCT GAT GTA ACG AAC AAC ATT 
Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn lie 
230 235 240 

TTA AAC AAC AAC ACC GGA GGC AAC ATC GCA GGG GCG TTG AGT AAC GCT 
Leu Asn Asn Asn Thr Gly Gly Asn lie Ala Gly Ala Leu Ser Asn Ala 
245 250 255 260 

TTC TCC CAA TAC CTT TAT TCG CTT TTA GGG GCT TAC CCC ACA AAA CTC 
Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
265 270 275 

AAT GGT AGC GAT GTG TCT GCG AAC GCT CTT TTA AGT GGT GCG GTA GGC 
Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
280 285 290 

CT GGG ACT TGT GCG GCT GCA GGG ACG GCT GGT GGC ACT TCT CTT AAC 
er Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
295 300 305 

ACT CAA AGC ACT TGC ACC GTT GCG GGC TAT TAC TGG CTC CCT AGC TTG 
Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
310 315 320 

ACT GAC AGG ATT TTA AGC ACG ATC GGC AGC CAG ACT AAC TAC GGC ACG 
Thr Asp Arg lie Leu Ser Thr lie Gly Ser Gin Thr Asn Tyr Gly Thr 
325 330 335 340 

AAC ACC AAT TTC CCC AAC ATG CAA CAA CAG CTC ACC TAC TTG AAT GCG 
Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
345 350 355 

GGG AAT GTG TTT TTT AAT GCG ATG AAT AAG GCT TTA GAG AAT AAG AAT 
Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
360 365 370 



72 
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GGA ACT AGT AGT GCT AGT GGA ACT AGT GGT GCG ACT GGT TCA GAT GGT 624 
Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
375 380 385 

CAA ACT TAC TCC ACA CAA GCT ATC CAA TAC CTT CAA GGC CAA CAA AAT 672 
Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
390 395 400 

ATC TTA AAT AAC GCA GCG AAC TTG CTC AAG CAA GAT GAA TTG CTC TTA 720 
lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
405 410 415 420 

GAA GCT TTC AAC TCT GCC GTA GCC GCC AAC ATT GGG AAT AAG GAA TTC 768 
Glu Ala Phe Asn Ser Ala Val Ala Ala Asn lie Gly Asn Lys Glu Phe 
425 430 435 

AAT TCA GCC GCT TTT ACA GGT TTG GTG CAA GGC ATT ATT GAT CAA TCT 816 
Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie lie Asp Gin Ser 
440 445 450 

AA GCG GTT TAT AAC GAG CTC ACT AAA AAC ACC ATT AGC GGG AGT GCG 864 
In Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr lie Ser Gly Ser Ala 
455 460 465 

GTT ATT AGC GCT GGG ATA AAC TCC AAC CAA GCT AAC GCT GTG CAA GGG 912 
Val lie Ser Ala Gly lie Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
470 475 480 

CGC GCT AGT CAG CTC CCT AAC GCT CTT TAT AAC GCG CAA GTA ACT TTG 960 
Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
485 490 495 500 

GAT AAA ATC AAT GCG CTC AAT AAT CAA GTG AGA AGC ATG CCT TAC TTG 1008 
Asp Lys lie Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
505 510 515 

CCC CAA TTC AGA GCC GGG AAC AGC CGT TCA ACG AAT ATT TTA AAC GGG 1056 
Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn lie Leu Asn Gly 
520 525 530 

TTT TAC ACC AAA ATA GGC TAT AAG CAA TTC TTC GGG AAG AAA AGG AAT 1104 
Phe Tyr Thr Lys lie Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
535 540 545 



TC GGT TTG CGC TAT TAT GGT TTC TTT TCT TAT AAC GGA GCG AGC GTG 1152 
le Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
550 555 560 

GGC TTT AGA TCC ACT CAA AAT AAT GTA GGG TTA TAC ACT TAT GGG GTG 1200 
Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
565 570 575 580 

GGG ACT GAT GTG TTG TAT AAC ATC TTT AGC CGC TCC TAT CAA AAC CGC 124 8 

Gly Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn Arg 
585 590 595 

TCT GTG GAT ATG GGC TTT TTT AGC GGT ATC CAA TTA GCC GGT GAG ACC 1296 
Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu Thr 
600 605 610 

TTC CAA TCC ACG CTC AGA GAT GAC CCC AAT GTG AAA TTG CAT GGG AAA 1344 
Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 



615 



620 



625 




ATC AAT AAC ACG CAC TTC CAG TTC CTC TTT GAC TTC GGT ATG AGG ATG 
lie Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
630 635 640 

AAC TTC GGT AAG TTG GAC GGG AAA TCC AAC CGC CAC AAC CAG CAC ACG 
Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
645 650 655 660 

GTG GAA TTT GGC GTA GTG GTG CCT ACG ATT TAT AAC ACT TAT TAC AAA 
Val Glu Phe Gly Val Val Val Pro Thr lie Tyr Asn Thr Tyr Tyr Lys 
665 670 675 

TCA GCA GGG ACT ACC GTG AAG TAT TTC CGT CCT TAT AGC GTT TAT TGG 
Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
680 685 690 

TCT TAT GGG TAT TCA TTC TAA 
Ser Tyr Gly Tyr Ser Phe * 
695 

(2) ANGABEN ZU SEQ ID NO: 48: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 519 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 48: 

Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
15 10 15 

Ser lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
20 25 30 

Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
35 40 45 



Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn lie 
50 55 60 



eu Asn Asn Asn Thr Gly Gly Asn lie Ala Gly Ala Leu Ser Asn Ala 
65 70 _ 75 80 

Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
85 90 95 

Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
100 105 110 

Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
115 120 125 

Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
130 135 140 

Thr Asp Arg lie Leu Ser Thr lie Gly Ser Gin Thr Asn Tyr Gly Thr 
145 150 155 160 
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Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
165 170 175 

Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
180 185 190 

Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
195 200 205 

Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
210 215 220 

lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
225 230 235 240 

Glu Ala Phe Asn Ser Ala Val Ala Ala Asn lie Gly Asn Lys Glu Phe 
245 250 255 

Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie lie Asp Gin Ser 
260 265 270 

In Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr lie Ser Gly Ser Ala 
275 280 285 

Val lie Ser Ala Gly lie Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
290 295 300 

Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
305 310 315 320 

Asp Lys lie Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
325 330 335 

Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn lie Leu Asn Gly 
340 345 350 

Phe Tyr Thr Lys lie Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
355 360 365 

lie Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
370 375 380 



Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
85 390 395 400 



ly Thr Asp Val Leu Tyr Asn lie Phe Ser Arg Ser Tyr Gin Asn Arg 
405 410 415 

Ser Val Asp Met Gly Phe Phe Ser Gly lie Gin Leu Ala Gly Glu Thr 
420 425 430 

Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 
435 440 445 

He Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
450 455 460 

Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
465 470 475 480 

Val Glu Phe Gly Val Val Val Pro Thr He Tyr Asn Thr Tyr Tyr Lys 
485 490 495 



Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
500 505 510 



Ser Tyr Gly Tyr Ser Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 49: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1062 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS152 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) IiAGE : 1 . .1062 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 49: 

TTG AAA CAT TTA ACC CCA CTC ACT CAC ACC ATC TTT AAA GCC TTA TGG 
Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
520 525 530 535 

CTA GGC ACA GCC TTA AGT GCA TCT TTA AGT TTA GCC GCA ACA GAA AGC 
Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
540 545 550 

CCC ACT AAA ACA GAG CCT AAG CCC GCT AAA GGG GTT AAA AAC AAG CCC 
Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
555 560 565 

AAA TCG CCC GTT ACT AAA GTC ATG ATG ACC AAT TGC GAC AAT ATT AAA 
Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
570 575 580 



GAT TTT AAC GCT AAG CAA AAA GAA GTC TTA AAA GCC GCT TAT CAA TTC 
sp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
585 590 595 



GGC TCT AAA GAA AAT TTA GGC TAT GAA ATG GCA GGC ATT GCA TGG AAA 
Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 
600 605 610 615 

GAG TCA TGC GCA GGG GTT TAT AAA ATC AAT TTT TCG GAT CCG AGC GCG 
Glu Ser Cys Ala Gly Val Tyr Lys lie Asn Phe Ser Asp Pro Ser Ala 
620 625 630 

GGC GTG TAT CAT TCT TAT ATC CCA AGC GTT CTA AAA AGC TAT GGG CAT 
Gly Val Tyr His Ser Tyr lie Pro Ser Val Leu Lys Ser Tyr Gly His 
635 640 645 

AAT GAT AGC CCC TTT TTG CGT AAT GTG ATG GGG GAA TTG CTC ATT AAA 
Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu lie Lys 
650 655 660 



76 




Q , 



GAC GAT GCG TTT GCT TCT GAA GTG GCT TTA AAA GAG TTG CTC TAT TGG 480 
Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
665 670 675 

AAA ACA CGC TAC CAT GAC AAT TTA AAA GAC ATG ATT AAA TCT TAC AAC 52 8 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met lie Lys Ser Tyr Asn 
680 685 690 695 

AAG GGC AGT CGT TGG GAA AGG AGC GAA AAA TCT AAC GCT GAT GCT GAA 576 
Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
700 705 710 

AAA TAT TAC GAA GAG ATA CAA GAC AGA ATC AGG CGT TTG AAA GAA TCT 624 
Lys Tyr Tyr Glu Glu lie Gin Asp Arg lie Arg Arg Leu Lys Glu Ser 
715 720 725 

AAA ATC TTT GAT TCG CAG TCT AGT AAT GAC CAA GAA TTG CAA AAA AGC 672 
Lys lie Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
730 735 740 

„GCT AAT AGC AAC CTG GAT TTA GAC CCT ATC GGC AAC GCC ATG CCC CAA 720 
la Asn Ser Asn Leu Asp Leu Asp Pro lie Gly Asn Ala Met Pro Gin 
745 750 755 

GCC TTA ATT GCC AAA GAA ACT AAA ATA GAA GAA ACC CAA GCA GAA AAA 768 
Ala Leu lie Ala Lys Glu Thr Lys lie Glu Glu Thr Gin Ala Glu Lys 
760 765 770 775 

TCC CAA GAA ATG AAA GAG ACA ACT AGC GAG CAA ACA AAA AGT AAG CCA 816 
Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
780 785 790 

GAA AAA GCA AAA GAT AAA CCC ATG TAT TTG GCG CAA ATC AAC AGC ACT 864 
Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin lie Asn Ser Thr 
795 800 805 

GAT TTC ACA CCC GTT AAA AAA AGC CCC AAA AAA CCG GCT AAA GTG AGC 912 
Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
810 815 820 

CAA AAA CAC TCC TTT AAG AAT AAC ATT AAA AAT AAT GTA AAA AAC AAC 960 
Gin Lys His Ser Phe Lys Asn Asn lie Lys Asn Asn Val Lys Asn Asn 
825 830 835 



CC AAA ACC GCT TCC AAA AAA CAA GAA ATG TGC AAA AAT TGC TCT CCA 100 8 

la Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
840 845 850 855 

GGG CAA AGG AAT GCG ATT TTA GCT AAC CAC ATC ACT CTC ATG CAA GAG 1056 
Gly Gin Arg Asn Ala lie Leu Ala Asn His lie Thr Leu Met Gin Glu 
860 865 870 

CTT TAA 1062 
Leu * 



(2) ANGABEN ZU SEQ ID NO: 50: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 354 Aminosauren 

(B) ART: Aminosaure 
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( D ) TOPOLOGIE : 1 inear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 

Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
15 10 15 

Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
20 25 30 

Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys AsiV Lys Pro 
35 40 45 

Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
50 55 60 

Asp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
65 70 75 80 

Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 

85 90 95 

Glu Ser Cys Ala Gly Val Tyr Lys lie Asn Phe Ser Asp Pro Ser Ala 
100 105 110 

Gly Val Tyr His Ser Tyr lie Pro Ser Val Leu Lys Ser Tyr Gly His 
115 120 125 

Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu lie Lys 
130 135 140 

Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
145 150 155 160 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met lie Lys Ser Tyr Asn 
165 170 175 

Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
180 185 190 

Lys Tyr Tyr Glu Glu lie Gin Asp Arg lie Arg Arg Leu Lys Glu Ser 
195 200 205 

ys lie Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
210 215 220 

Ala Asn Ser Asn Leu Asp Leu Asp Pro lie Gly Asn Ala Met Pro Gin 
225 230 235 240 

Ala Leu lie Ala Lys Glu Thr Lys lie Glu Glu Thr Gin Ala Glu Lys 
245 250 255 

Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
260 265 270 

Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin lie Asn Ser Thr 
275 280 285 

Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
290 295 300 
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Gin Lys His Ser Phe Lys Asn Asn lie Lys Asn Asn Val Lys Asn Asn 
305 310 315 320 

Ala Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
325 330 335 

Gly Gin Arg Asn Ala lie Leu Ala Asn His lie Thr Leu Met Gin Glu 
340 345 350 

Leu * 



(2) ANGABEN ZU SEQ ID NO: 51: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 2202 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS155 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..2202 



ft 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 51: 

ATG GCA AAC GAA CGC TCC AAA TTA GCT TTT AAA AAG ACT TTC CCT GTC 

Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 

355 360 365 370 

TTT AAA CGC TTT TTG CAA TCC AAA GAC TTA GCC CTT GTG GTC TTT GTG 

Phe Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 

375 380 385 

ATC GCT ATT TTG GCG ATC ATT ATC GTG CCG TTA CCG CCT TTT GTG TTG 

lie Ala lie Leu Ala lie lie lie Val Pro Leu Pro Pro Phe Val Leu 
390 395 400 



[AT TTT TTA CTC ACG ATT TCT ATC GCG CTG TCG GTG TTG ATT ATT TTA 
r Asp Phe Leu Leu Thr lie Ser lie Ala Leu Ser Val Leu He He Leu 
405 410 415 

ATT GGG CTT TAT ATT GAC AAG CCG ACT GAT TTT AGC GCT TTC CCC ACT 
He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
420 425 430 

TTA TTG CTC ATT GTA ACC TTG TAT CGC TTG GCT TTA AAT GTC GCC ACC 
Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
435 440 * 445 450 

ACT AGA ATG ATT TTA ACG CAA GGC TAT AAA GGG CCT AGT GCG GTG AGC 
Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
455 460 465 



GAT ATT ATC ACG GCG TTT GGG GAA TTT AGC GTG AGC GGG AAT TAT GTG 
Asp He He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 



470 



475 



480 



ATT GGG GCG ATT ATC TTT AGT ATT TTA GTG CTA GTG AAT CTA TTA GTG 
lie Gly Ala lie lie Phe Ser lie Leu Val Leu Val Asn Leu Leu Val 
485 490 495 

GTT ACT AAT GGC TCT ACT AGG GTT ACT GAA GTG AGG GCG CGA TTT GCC 
Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
500 505 510 

CTA GAT GCT ATG CCA GGA AAG CAA ATG GCG ATT GAT GCG GAT TTA AAC 
Leu Asp Ala Met Pro Gly Lys Gin Met Ala lie Asp Ala Asp Leu Asn 
515 520 525 530 

TCA GGA CTT ATT GAC GAT AAG GAA GCC AAA AAA CGG CGC GCC GCT CTA 
Ser Gly Leu lie Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
535 540 545 



AGC CAA GAA GCG GAT TTT TAT GGC GCG ATG GAT GGC GCA TCT AAA TTC 
Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
550 555 560 




TC AAA GGC GAT GCG ATC GCT TCT ATC ATC ATC ACG CTT ATC AAT ATC 
Val Lys Gly Asp Ala lie Ala Ser lie lie lie Thr Leu lie Asn lie 
565 570 575 

ATT GGA GGG TTT TTA GTG GGC GTG TTT CAA AGG GAT ATG AGC TTG AGC 
lie Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
580 585 590 

TTT AGC GCT AGC ACT TTC ACT ATC TTA ACC ATT GGC GAT GGG CTT GTG 
Phe Ser Ala Ser Thr Phe Thr lie Leu Thr lie Gly Asp Gly Leu Val 
595 600 605 610 

GGG CAA ATC CCT GCC TTA ATC ATT GCG ACA GCG ACC GGT ATT GTC GCC 
Gly Gin lie Pro Ala Leu lie lie Ala Thr Ala Thr Gly lie Val Ala 
615 620 625 

ACT CGC ACC ACG CAA AAT GAA GAA GAG GAC TTT GCT TCC AAA CTC ATC 
Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu lie 
630 635 640 

ACA CAG CTC ACC AAT AAA AGC AAA ACT TTA GTG ATT GTG GGA GCG ATT 
fhr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val lie Val Gly Ala lie 
645 650 655 

TTA TTG CTT TTT GCC ACC ATT CCT GGA CTC CCT ACC TTT TCT TTA GCG 
Leu Leu Leu Phe Ala Thr lie Pro Gly Leu Pro Thr Phe Ser Leu Ala 
660 665 670 

TTT GTA GGG ACT CTC TTT TTA TTC ATC GCA TGG CTG ATT AGC AGG GAG 
Phe Val Gly Thr Leu Phe Leu Phe lie Ala Trp Leu He Ser Arg Glu 
675 680 685 690 

GGG AAA GAC GGG CTG CTC ACT AAA TTA GAA AAT TAT TTG AGT CAA AAA 
Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
695 700 705 

TTC GGC TTG GAT TTG AGC GAA AAA CCC CAC AGC TCC AAA ATC AAA CCC 
Phe Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
710 715 720 
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CAC ACC CCA ACC ACA AGG GCT AAA ACC CAA GAA GAG CTT AAA AGA GAA 
His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
725 730 735 

GAA GAG CAA GCG ATT GAT GAA GTG TTA AAA ATT GAA TTT TTA GAA CTG 
Glu Glu Gin Ala lie Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
740 745 750 

GCT TTA GGC TAT CAA CTC ATC AGT CTT GCG GAC ATG AAA CAA GGG GGC 
Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Gly Gly 
755 760 765 770 

GAT TTG TTA GAA AGG ATT AGG GGT ATT AGA AAA AAG ATA GCG AGC GAT 
Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
775 780 785 

TAT GGT TTT TTG ATG CCT CAA ATC CGG ATC AGG GAT AAT TTG CAG CTC 
Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
790 795 800 



CCC CCA ACG CAT TAT GAA ATC AAA CTT AAA GGC ATT GTG ATT GGT GAG 
ro Pro Thr His Tyr Glu He Lys Leu Lys Gly He Val He Gly Glu 
805 810 815 



ys 



GGC ATG GTG ATG CCA GAC AAG TTT TTA GCC ATG AAT ACC GGT TTT GTG 
Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
820 825 830 

AAT AAA GAA ATT GAA GGC ATT CCT ACT AAA GAG CCG GCT TTT GGA ATG 
Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
835 840 845 850 

GAC GCT TTA TGG ATT GAA ACT AAA AAT AAA GAA GAA GCC ATT ATT CAA 
Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
855 860 865 

GGC TAT ACC ATT ATT GAT CCA AGC ACC GTT ATT GCG ACG CAC ACC AGC 
Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
870 875 880 

GAA TTA GTG AAA AAA TAC GCT GAA GAT TTT ATC ACT AAA GAT GAA GTG 
Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
885 890 895 



TCC CTT TTA GAG CGC TTG GCC AAA GAT TAT CCT ACG ATT GTA GAA 
ys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
900 905 910 



GAG AGT AAA AAA ATC CCC ACC GGT GCG ATC CGA TCA GTC TTG CAA GCC 
Glu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
915 920 925 930 

TTG TTA CAT GAA AAA ATC CCC ATT AAA GAC ATG CTC ACT ATT TTA GAA 
Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
935 940 945 

ACG ATT ACC GAT ATT GCC CCA TTG GTT CAA AAC GAT GTG AAT ATC TTA 
Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
950 955 960 



ACC GAA CAA GTG AGG GCG AGG CTT TCT AGG GTG ATC ACT AAC GCT TTT 
Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
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965 970 975 

AAA TCT GAA GAC GGG CGT TTG AAA TTT TTA ACC TTT TCT ACC GAT AGC 
Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
980 985 990 

GAA CAA TTT TTG CTT AAT AAA TTG CGA GAA AAT GGC ACT TCT AAA AGT 
Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
995 1000 1005 1010 

TTG CTG CTC AAT GTG GGC GAA TTG CAA AAA CTC ATT GAA GTG GTC TCT 
Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu lie Glu Val' Val Ser 
1015 1020 1025 

GAA GAG GCC ATG AAA GTC TTG CAA AAA GGG ATC GCT CCG GTG ATT TTG 
Glu Glu Ala Met Lys Val Leu Gin Lys Gly lie Ala Pro Val lie Leu 
1030 1035 1040 



A 



ATC GTA GAG CCT AAT TTA AGA AAA GCT CTT TCC AAT CAA ATG GAG CAA 
lie Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
1045 1050 1055 



CC AGG ATT GAT GTG ATC GTG CTA AGC CAT GCG GAA TTA GAT CCT AAC 
Ala Arg lie Asp Val lie Val Leu Ser His Ala Glu Leu Asp Pro Asn 
1060 1065 1070 

TCT AAT TTT GAA GCT TTA GGC ACG ATC CAT ATT AAC TTT TAA 
Ser Asn Phe Glu Ala Leu Gly Thr lie His lie Asn Phe * 
1075 1080 1085 



(2) ANGABEN ZU SEQ ID NO: 52: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 734 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 

Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
1 5 10 15 

he Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
20 25 30 

He Ala He Leu Ala He "He He Val Pro Leu Pro Pro Phe Val Leu 
35 40 45 

Asp Phe Leu Leu Thr He Ser He Ala Leu Ser Val Leu He He Leu 
50 55 60 

He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
65 70 75 80 

Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
85 90 95 

Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
100 105 110 
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Asp lie He Thr Ala Fhe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
115 120 125 

He Gly Ala He He Phe Ser He Leu Val Leu Val Asn Leu Leu Val 
130 135 140 

Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
145 150 155 160 

Leu Asp Ala Met Pro Gly Lys Gin Met Ala He Asp Ala Asp Leu Asn 
165 170 175 

Ser Gly Leu He Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
180 185 190 

Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
195 200 205 



Val Lys Gly Asp Ala He Ala Ser He He lie Thr Leu He Asn He 
210 215 220 



le Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
25 230 235 240 



Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
245 250 255 

Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
260 265 270 

Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
275 280 285 

Thr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
290 295 300 

Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
305 310 315 320 

Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
325 330 335 



Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
340 345 350 



he Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
355 360 365 

His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
370 375 380 

Glu Glu Gin Ala He Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
385 390 395 400 

Ala Leu Gly Tyr Gin Leu lie Ser Leu Ala Asp Met Lys Gin Gly Gly 
405 410 415 

Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
420 425 430 

Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
435 440 445 



83 

Pro Pro Thr His Tyr Glu He Lys Leu Lys Gly He Val He Gly Glu 
450 455 460 

Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
465 470 475 480 

Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
485 490 495 

Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
500 505 510 

Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
515 520 525 

Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
530 535 540 



» 



Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
545 550 555 560 



lu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
565 570 575 



Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
580 585 590 

Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
595 600 605 

Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
610 615 620 

Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
625 630 635 640 

Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
645 650 655 

Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu He Glu Val Val Ser 
660 665 670 

Glu Glu Ala Met Lys Val Leu Gin Lys Gly He Ala Pro Val He Leu 
675 680 685 

le Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
690 695 700 

Ala Arg He Asp Val He Val Leu Ser His Ala Glu Leu Asp Pro Asn 
705 710 715 720 

Ser Asn Phe Glu Ala Leu Gly Thr He His He Asn Phe * 
725 730 

(2) ANGABEN ZU SEQ ID NO: 53: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 189 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMI TTELB ARE HERKUNFT: 

(B) CLON(E) : HPC157 (HPC181) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..189 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 

ATG CAA AAA GAA CAA GAA GCC CGA GAA ATC GCT AAA AAA GCC GTT CAA 
Met Gin Lys Glu Gin Glu Ala Arg Glu lie Ala Lys Lys Ala Val Gin 
735 740 745 750 

ATC GTG TTT TTT TTA GGG ATT GTG GTG GTG CTT TTG ATG ATG ATA AAC 
lie Val Phe Phe Leu Gly lie Val Val Val Leu Leu Met Met lie Asn 
755 760 765 



CTT TAC ATG CTC ATC AAT CAA ATC AAC GCG AGC GCT AAA ATG AGC CAA 
eu Tyr Met Leu lie Asn Gin lie Asn Ala Ser Ala Lys Met Ser Gin 
770 775 780 



CAA ATC AAA AAA ATA GAA GAA AGG CTT AAC CAA GGG CAA AAA TAG 
Gin lie Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
785 790 795 



(2) ANGABEN ZU SEQ ID NO: 54: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 63 Amino saur en 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: 

Met Gin Lys Glu Gin Glu Ala Arg Glu He Ala Lys Lys Ala Val Gin 
15 10 15 
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lie Val Phe Phe Leu Gly He Val Val Val Leu Leu Met Met He Asn 
20 25 30 



eu Tyr Met Leu He Asn Gin He Asn Ala Ser Ala Lys Met Ser Gin 
35 40 45 

Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
50 55 60 

(2) ANGABEN ZU SEQ ID NO: 55: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1008 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS183 
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(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1008 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: 

ATG TTA GTT ACT CGC TTT AAA AAA GCT TTC ATT TCT TAT TCT TTA GGC 
Met Leu Val Thr Arg Phe Lys Lys Ala Phe lie Ser Tyr Ser Leu Gly 
65 70 75 

GTG CTT GTC GCT TCA TTA TGG TTG AAC GTG TGC AAC GCT TCA GCG CAA 
Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
80 85 90 95 

GAA GTC AAA GTC AAG GAT TAT TTC GGG GAG CAA ACC ATC AAG CTT CCT 
Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr He Lys Leu Pro 
100 105 110 



i 



GTT TCT AAA ATA GCC TAT ATA GGG AGC TAT GTA GAA GTG CCT GCC ATG 
Val Ser Lys He Ala Tyr He Gly Ser Tyr Val Glu Val Pro Ala Met 
115 120 125 



CTT AAT GTT TGG AAT AGG GTT GTA GGC GTT TCG GAT TAC GCT TTT AAA 
Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
130 135 140 

GAC GAT ATT GTC AAA GCC ACT CTC AAA GGC GAA GAT CTT AAA CGC GTC 
Asp Asp lie Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arq Val 
145 150 155 

AAA CAC ATG AGC ACT GAT CAT ACA GCC GCG CTA AAT GTA GAG CTT TTA 
Lys His Met Ser Thr Asp His Thr Ala Ala Leu. Asn Val Glu Leu Leu 
160 165 170 175 

AAA AAG CTT AGC CCT GAT CTT GTG GTA ACC TTT GTG GGC AAC CCT AAA 
Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
180 185 190 

GCG GTA GAG CAT GCG AAA AAA TTT GGT ATA TCA TTT CTT TCT TTT CAA 
Ala Val Glu His Ala Lys Lys Phe Gly He Ser Phe Leu Ser Phe Gin 
195 200 205 



£AG ACA ACG ATT GCA GAG GCC ATG CAG GCC ATG CAA GCT CAA GCC ACG 
lu Thr Thr He Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
210 215 220 

GTT TTA GAG ATT GAC GCT TCC AAA AAA TTC GCC AAA ATG CAA GAA ACT 
Val Leu Glu He Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
225 230 235 

TTG GAT TTT ATT GCT GAG CGT TTG AAA AAT GTC AAA AAG AAA AAG GGG 
Leu Asp Phe He Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lvs Glv 
240 245 250 255 

GTG GAG CTT TTC CAT AAA GCC AAT AAA ATC AGC GGC CAT CAA GCC ATT 
Val Glu Leu Phe His Lys Ala Asn Lys He Ser Gly His Gin Ala He 
260 265 270 

AGC TCA GAC ATT TTA GAA AAA GGG GGC ATA GAC AAT TTT GGC TTG AAA 
Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn Phe Gly Leu Lys 
275 280 285 
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TAT GTC AAA TTT GGG CGT GCT GAC ATT AGC GTG GAA AAA ATC GTT AAA 

Tyr Val Lys Phe Gly Arg Ala Asp lie Ser Val Glu Lys lie Val Lys 

290 295 300 

GAA AAC CCT GAG ATT ATC TTT ATT TGG TGG ATA AGC CCA CTC ACG CCT 

Glu Asn Pro Glu lie lie Phe lie Trp Trp lie Ser Pro Leu Thr Pro 
305 310 315 

GAA GAT GTG TTA AAC AAC CCC AAA TTT GCT ACC ATC AAA GCC ATT AAA 

Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr lie Lys Ala lie Lys 

320 325 330 335 

AAC AAG CAG GTT TAT AAA CTC CCC ACA ATG GAT ATT GGC GGG CCT AGA 

Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp lie Gly Gly Pro Arg 

340 345 350 

GCC CCA CTC ATA AGT CTT TTT ATC GCT CTA AAA GCC CAC CCT GAA GCC 

Ala Pro Leu lie Ser Leu Phe lie Ala Leu Lys Ala His Pro Glu Ala 

355 360 365 



TTT AAG GGC GTG GAT ATT AAT GCG ATG GTT AAA GAC TAC TAT AAA GTG 
he Lys Gly Val Asp lie Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
370 375 380 



GTT TTT GAT TTG AAT GAT GCA GAG GTT GAG CCC TTT TTA TGG CAT TAA 
Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 56: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 336 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe lie Ser Tyr Ser Leu Gly 
15 10 15 



Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
20 25 30 



Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr lie Lys Leu Pro 
35 40 45 

Val Ser Lys lie Ala Tyr lie Gly Ser Tyr Val Glu Val Pro Ala Met 
50 55 60 

Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
65 70 75 80 

Asp Asp lie Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 
85 90 95 

Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
100 105 110 

Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
115 120 125 
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Ala Val Glu His Ala Lys Lys Phe Gly lie Ser Phe Leu Ser Phe Gin 
130 135 140 

Glu Thr Thr lie Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
145 150 155 160 

Val Leu Glu lie Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
165 170 175 

Leu Asp Phe lie Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
180 185 190 

Val Glu Leu Phe His Lys Ala Asn Lys lie Ser Gly His Gin Ala lie 
195 200 205 

Ser Ser Asp lie Leu Glu Lys Gly Gly lie Asp Asn Phe Gly Leu Lys 
210 215 220 

Tyr Val Lys Phe Gly Arg Ala Asp lie Ser Val Glu Lys lie Val Lys 
225 230 235 240 

5lu Asn Pro Glu lie lie Phe lie Trp Trp lie Ser Pro Leu Thr Pro 
245 250 255 

Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr lie Lys Ala lie Lys 
260 265 270 

Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp lie Gly Gly Pro Arg 
275 280 285 

Ala Pro Leu lie Ser Leu Phe lie Ala Leu Lys Ala His Pro Glu Ala 
290 295 300 

Phe Lys Gly Val Asp lie Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
305 310 315 320 

Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
325 330 335 

(2) ANGABEN ZU SEQ ID NO: 57: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 240 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS186 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..240 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 57: 



ATG GGC GGA TTC ACA AGC ATA TGG CAT TGG GTC ATT GTT TTA TTA GTG 
Met Gly Gly Phe Thr Ser lie Trp His Trp Val lie Val Leu Leu Val 
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340 345 350 

ATT GTG TTG TTA TTT GGG GCT AAA AAG ATC CCA GAA TTG GCT AAA GGT 96 
lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
355 360 365 

TTA GGC AGT GGG ATT AAG AAT TTC AAA AAA GCC GTG AAA GAC GAT GAA 144 
Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
370 375 380 

GAA GAG GCT AAA AAC GAG CCA AAA ACC CTA GAC GCT CAA GCA ACG CAA 192 
Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
385 390 395 400 

ACC AAA GTG CAT GAG AGT AGC GAG ATT AAA AGC AAA CAA GAA AGT TAA 240 
Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
405 410 415 

(2) ANGABEN ZU SEQ ID NO: 58: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 80 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 58: 

Met Gly Gly Phe Thr Ser lie Trp His Trp Val lie Val Leu Leu Val 
15 10 15 

lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
20 25 30 

Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
35 40 45 

Glu Glu Ala Lys Asn. Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
50 55 60 

Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
65 70 75 80 

2) ANGABEN ZU SEQ ID NO: 59: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1764 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear ' 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS188 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1764 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

ATG AAA AAC TTT TCC CCA CTT TGT TGT TTT AAA AAG CTC AAA AAA CGC 
Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 

85 90 95 

CAT TTA ATC GCT TTG AGC CTG CCC TTG CTT TCT TAT GCT AAT GGC TTT 
His Leu lie Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
100 105 110 

AAA ATC CAA GAG CAA AGC CTG AAT GGC ACG GCT TTA GGC TCG GCG TAT 
Lys lie Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
115 120 125 

GTC GCT GGG GCT AGG GGG GCT GAT GCT TCC TTT TAT AAC CCG GCG AAT 
Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
130 135 140 



ATG GGC TTT ACT AAC GAT TGG GAT GAA AAC AGA AGC GAA TTT GAA ATG 
Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
145 150 155 160 



CC ACC ACC GTG ATT AAT ATC CCG GCC TTT AAG TTT CAA GTC CCT ACG 
'Thr Thr Thr Val He Asn He Pro Ala Phe Lys Phe Gin Val Pro Thr 
165 170 175 



ACT AAT CAA GGC TTG TAT TCG GTT ACG AGC TTA CAA ATT GAT AAA AGC 
Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin He Asp Lys Ser 
180 185 190 

CAA CAA AAT ATT TTA GGC ATC ATC AAC ACT ATA GGG CTT AGC AAT ATC 
Gin Gin Asn He Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
195 200 205 



CTT AAA GCG CTT GGC AAT ACG GCC GCT ACC AAT GGC TTA TCA CAA GCA 
Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
210 215 220 

ATC AAT CGG GTT CAA GGG CTT ATG AAT CTA ACC AAT CAA AAA GTC GTA 
He Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
225 230 235 240 



ACC CTC GCT TCA AAA CCT GAC ACC CAA ATC GTG AAT GGC TGG ACG GGA 
" " r Leu Ala Ser Lys Pro Asp Thr Gin He Val Asn Gly Trp Thr Gly 
245 250 255 



ACG ACT AAT TTT GTT TTA CCC AAA TTC TTT TAT AAA ACG CGC ACG CAT 
Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
260 265 270 



AAC GGC TTC ACT TTT GGG GGG AGT TTT ACC GCT CCT AGC GGG TTG GGC 
Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
275 280 285 

ATG AAA TGG AAT GGT AAA GGG GGG GAA TTT TTG CAT GAC GTG TTT ATC 
Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe He 
290 295 300 

ATG ATG GTA GAG CTT GCC CCT AGC ATG AGC TAT ACT GTT AAT AAG CAC 
Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
305 310 315 320 
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TTT TCC GTG GGC GTG GGC TTA AGG GGG CTT TAT GCG ACC GGG AGC TTT 768 
Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
325 330 335 

AAT AAC ACC GTT TAT GTG CCT TTA GAG GGC GCT TCG GTT TTG AGC GCG 816 
Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
340 345 350 

GAG CAA ATT TTA AAT TTA CCC AAC AAT GTT TTT GCC GAT CAA GTG CCA 864 
Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
355 360 365 

AGT AAC ATG ATG ACT TTA TTA GGC AAT ATT GGC TAC CAA CCA GCG CTT 912 
Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
370 375 380 

AAT TGC CAA AAA GCC GGT GGG GAT ATG AGC GAT CAG AGC TGT CAA GAG 960 
Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
385 390 395 400 

TTT TAT AAC GGC TTG AAA AAA ATC ATG GGC TAT AGC GGC TTA ATC AAA 1008 
he Tyr Asn Gly Leu Lys Lys lie Met Gly Tyr Ser Gly Leu He Lys 
405 410 415 

GCG AGC GCG AAT CTT TAT GGC ACG ACT CAA GTC GTG CAA AAA TCT AAC 1056 
Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
420 425 430 

GGG CAA GGC GTA TCG GGG GGC TAT AGA GTG GGT TCG AGT TTG CGT GTG 1104 
Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
435 440 445 

TTT GAT CAT GGC ATG TTT TCG GTG GTG TAT AAT TCT TCA GTT ACA TTC 1152 
Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
450 455 460 

AAT ATG AAA GGC GCT CTA GTG GCT ATC ACC GAG CTT GGC CCT TCT TTA 1200 
Asn Met Lys Gly Ala Leu Val Ala He Thr Glu Leu Gly Pro Ser Leu 
465 470 475 480 

GGG AGC GTT TTG ACT AAA GGC AGC TTG AAT ATC AAT GTT TCA CTC CCC 1248 
Gly Ser Val Leu Thr Lys Gly Ser Leu Asn He Asn Val Ser Leu Pro 
485 490 495 

h ACC CTA AGC CTA GCC TAC GCC CAC CAA TTT TTT AAA GAC CAT TTA 1296 
n Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
500 505 510 

AGA ATA GAG GGG GTG TTT GAG CGT ACC TTT TGG AGT CAA GGG AAT AAA 1344 
Arg He Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
515 520 525 

TTT TTA GTA ACC CCT GAT TTT GCG AAC GCT ACT TAC AAG GGC TTG AGC 1392 
Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
530 535 540 

GGA ACG GTG GCT TCA CTA GAC TCT GAG ACG CTT AAA AAA ATG GTA GGC 1440 
Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
545 550 555 560 

TTA GCG AAT TTT AAA AGC GTG ATG AAC ATG GGG GCT GGC TGG AGA GAC 148 8 

Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
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565 570 575 

ACC AAC ACC TTT AGA TTA GGG GTA ACT TAC ATG GGT AAA AGC TTG CGT 1536 
Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
580 585 590 

TTG ATG GGT GCT ATT GAT TAT GAC CAA GCC CCA AGC CCC CAA GAC GCG 1584 
Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
595 600 605 

ATA GGT ATC CCA GAT TCC AAT GGC TAT ACC GTG GCT TTT GGG ACT AAA 1632 
lie Gly lie Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
610 615 620 

TAC AAT TTT AGG GGC TTT GAT TTA GGC GTA GCG GGG AGT TTC ACT TTT 1680 
Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
625 630 635 640 



AAA AGC AAC CGC TCC AGT TTG TAT CAA TCC CCA AAC ATT GGG CAA TTG 1728 
Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn lie Gly Gin Leu 
645 650 655 



[GA ATC TTT AGC GCC TCT TTA GGC TAT CGC TGG TAA 1764 
g lie Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
660 665 



(2) ANGABEN ZU SEQ ID NO: 60: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 588 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 60: 

Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
15 10 15 

His Leu lie Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
20 25 30 

s lie Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
35 40 45 

Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
50 "55 60 

Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
65 70 75 80 

Thr Thr Thr Val lie Asn lie Pro Ala Phe Lys Phe Gin Val Pro Thr 

85 90 95 

Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin lie Asp Lys Ser 
100 105 110 

Gin Gin Asn lie Leu Gly lie lie Asn Thr lie Gly Leu Ser Asn lie 
115 120 125 

Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
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130 135 140 

lie Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
145 150 155 160 

Thr Leu Ala Ser Lys Pro Asp Thr Gin lie Val Asn Gly Trp Thr Gly 
165 170 175 

Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
180 185 190 

Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
195 200 205 

Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe lie 
210 215 220 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
225 230 235 240 

he Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
245 250 255 

sn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
260 265 270 

Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
275 280 285 

Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
290 295 300 

Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
305 310 315 320 

Phe Tyr Asn Gly Leu Lys Lys lie Met Gly Tyr Ser Gly Leu lie Lys 
325 330 335 

Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
340 345 350 

Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
355 360 365 

e Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
370 375 380 

Asn Met Lys Gly Ala Leu Val Ala lie Thr Glu Leu Gly Pro Ser Leu 
385 390 395 400 

Gly Ser Val Leu Thr Lys Gly Ser Leu Asn lie Asn Val Ser Leu Pro 
405 410 415 

Gin Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
420 425 430 

Arg He Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
435 440 445 

Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
450 455 460 
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Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 

465 470 475 480 

Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
485 490 495 

Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 

500 505 510 

Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 

515 520 525 

lie Gly lie Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 

530 535 540 

Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 

545 550 555 560 



Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn lie Gly Gin Leu 
565 570 575 



g lie Phe Ser Ala Ser Leu Gly Tyr Arg Trp 
580 585 



(2) ANGABEN ZU SEQ ID NO: 61: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1443 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS190 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL; CDS 

(B) LAGE:1..1443 



ei 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 61: 



G GAA TTG AAA AAA ATC GCC CTT ATT TTA GAT GGC ATT GTA GCA AAA 
feu Glu Leu Lys Lys lie Ala Leu lie Leu Asp Gly lie Val Ala Lys 
590 595 600 

AAT TTT TTA GAC TTG GTG CTA AGG CAT TAT TCT AAT CAT AAT TTT TAT 
Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
605 610 615 620 

ATA GTG GTT GTC AAA AAT GAG AGC CTT ATC CCT AAA AAT TAC CCG AGC 
lie Val Val Val Lys Asn Glu Ser Leu lie Pro Lys Asn Tyr Pro Ser 
625 630 635 

ACT TTC GCT TTT TAT TGT TTT GAT GCG ACT TCT AGT TTC AGG CTT TTG 
Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
640 645 650 



CAA GTG TTA AAC GAT GAG GTG AGC GAT GCG TTT TTA ATC ATA CAA GAT 
Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
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655 660 665 

TTT AAA GAA CAG CGC ATC ATT CAT AAA ATC ATT CAA ACC CAT TTC AAA 28 8 

Phe Lys Glu Gin Arg lie lie His Lys lie lie Gin Thr His Phe Lys 
670 675 680 

CGC ATG CGC GTG GTT TTG AGC GTG AAA AAA GAT GGT GAA AAA ACT TTA 336 
Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
685 690 695 700 

GAA AAT AAT GAA GAA AAT AAA GAT GAA AAG CTT ATT TTG ATT GAT GAA 384 
Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu lie Leu lie Asp Glu 
705 710 715 

TTT GAA GTT TTA GCC AAT AAA TTC ATT TCT CGT TTG CCT AAT ATC CCT 432 
Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
720 725 730 

AGC ACC CCT AGA GAA TTT GGG TTA GCC AAA GGC GAG ATC ATG GAG ATT 480 
Ser Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu He 
735 740 745 

IJaT GTG CCT TTT GGG AGT ATT TTT CCT TAC AGG CAT ATT GGC TCT ATC 52 8 

Asp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser He 
750 755 760 

AGC CAA CAA GAA TAC AGG ATT GTA GGG CTT TAT CGC AAC GAT GTT TTG 576 
Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
765 770 775 780 

TTG CTC TCC ACT AAA TCT TTA GTT ATC CAG CCA CGA GAC ATT CTT TTA 624 
Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
785 790 795 

GTG GCG GGT AAT CCG GAA ATT TTA AAC GCG GTG TAT CTT CAG GTC AAA 672 
Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
800 805 810 



AGC AAT GTC GGG CAG TTC CCA GCC CCC TTT GGT AAG AGC ATT TAT TTA 720 
Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
815 820 825 



# 



AC ATT GAT ATG CGC TTA CCA AAG CCG AAA GCA ATG ATG CCC GAT GTG 768 
r lie Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
830 835 840 



TAT CAA GCC TTG TTT TTG CAC AAA CAT TTA AAG AGC TAC AAG CTC TAC 816 
Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
845 850 855 860 

ATT CAG GTT TTA CAC CCC ACT AGC CCT AAG TTT TGC CAT AAA TTT TTA 864 
He Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
865 870 875 

TCG CTA GAA ACC GAA AGC ATT GAA GTG AAT TTT GAT TTT TAT GGG AAA 912 
Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
880 885 890 

AGT TTT ATC CAA AAA CTC CAT GAA GAC CAC CAG AAA AAA ATG GGT TTG 960 
Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
895 900 905 
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ATT GTG GTA GGC AGA GAG CTT TTT TTA TCT AAA AAA CAC CGA AAA GCC 1008 
lie Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
910 915 920 

CTA TAT AAA ACA GCC ACC CCG GTT TAT AAA ACC AAC ACT TCC GGC TTG 1056 
Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
925 930 935 940 

TCT AAA ACC TCT CAA AGC GTG GTG GTG TTG AAT GAA AGC TTG GAT ATC 1104 
Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp lie 
945 950 955 

AAT GAG GAC ATG TCT TCA GTG ATC TTT GAT GTG TCT ATG CAA ATG GAT 1152 
Asn Glu Asp Met Ser. Ser Val lie Phe Asp Val Ser Met Gin Met Asp 
960 965 970 

TTG GGC TTG TTG CTC TAT GAT TTT GAC CCT AAC AAG CGC TAT AAA AAC 1200 
Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
975 980 985 

fAG ATT GTC AAT CAT TAT GAA AAT TTA GCC AAC ACG CTC AAC CGC AAG 1248 
lu lie Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
990 995 1000 

ATT GAG ATT TTT CAA ACC GAT ATT AGA AAT CCT ATC ATG TAT CTC AAT 1296 
lie Glu lie Phe Gin Thr Asp lie Arg Asn Pro lie Met Tyr Leu Asn 
1005 1010 1015 1020 

TCT TTA AGA AAT CCC ATT TTG CAT TTC ATG CCT TTT GAA GAG TGC ATC 1344 
Ser Leu Arg Asn Pro lie Leu His Phe Met Pro Phe Glu Glu Cys lie 
1025 1030 1035 

ACG CAC ACG CGC TTT TGG TGG TTT TTA TCC ACT AAA GTG GAA AAA TTA 1392 
Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
1040 1045 1050 

GCG TTT TTA AAC GAT GAT AAC CCT CAA ATT TTT ATC CCT GTA GCG GAG 144 0 

Ala Phe Leu Asn Asp Asp Asn Pro Gin lie Phe lie Pro Val Ala Glu 
1055 1060 1065 

TGA 1443 



) ANGABEN ZU SEQ ID NO: 62: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 481 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 62: 

Leu Glu Leu Lys Lys lie Ala Leu lie Leu Asp Gly lie Val Ala Lys 
15 10 15 

Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
20 25 30 

lie Val Val Val Lys Asn Glu Ser Leu lie Pro Lys Asn Tyr Pro Ser 
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35 40 45 

Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
50 55 60 

Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
65 70 75 80 

Phe Lys Glu Gin Arg lie lie His Lys lie lie Gin Thr His Phe Lys 
85 90 95 

Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
100 105 110 

Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu lie Leu lie Asp Glu 
115 120 125 

Phe Glu Val Leu Ala Asn Lys Phe lie Ser Arg Leu Pro Asn lie Pro 
130 135 140 

er Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu lie Met Glu lie 
45 150 155 160 

w Asp Val Pro Phe Gly Ser lie Phe Pro Tyr Arg His lie Gly Ser lie 
165 170 175 

Ser Gin Gin Glu Tyr Arg lie Val Gly Leu Tyr Arg Asn Asp Val Leu 
180 185 190 

Leu Leu Ser Thr Lys Ser Leu Val lie Gin Pro Arg Asp lie Leu Leu 
195 200 205 

Val Ala Gly Asn Pro Glu lie Leu Asn Ala Val Tyr Leu Gin Val Lys 
210 215 220 

Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser lie Tyr Leu 
225 230 235 240 

Tyr lie Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
245 250 255 

Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
260 265 270 

e Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
275 280 285 

Ser Leu Glu Thr Glu Ser lie Glu Val Asn Phe Asp Phe Tyr Gly Lys 
290 295 300 

Ser Phe lie Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
305 310 315 320 

lie Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
325 330 335 

Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
340 345 350 

Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp lie 
355 360 365 
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Asn Glu Asp Met Ser Ser Val lie Phe Asp Val Ser Met Gin Met Asp 
370 375 380 

Leu Gly Leu Leu Leu Tyr. Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
385 390 395 400 

Glu lie Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
405 410 415 

lie Glu lie Phe Gin Thr Asp lie Arg Asn Pro He Met Tyr Leu Asn 
420 425 430 

Ser Leu Arg Asn Pro He Leu His Phe Met Pro Phe Glu Glu Cys He 
435 440 445 

Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
450 455 460 

Ala Phe Leu Asn Asp Asp Asn Pro Gin He Phe He Pro Val Ala Glu 
465 470 475 480 



(2) ANGABEN ZU SEQ ID NO: 63: 

( i ) S E QUENZ KENNZE I CHEN : 

(A) LANGE: 543 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC008 (HPC114, HPC145) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..543 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 63: 

!g AAA AGC ATG CGT TTT AGC TAT ATT GAG CCA AGA GCG AAA TAC CTT 
' n^Piot Lys Ser Met Arg Phe Ser Tyr He Glu Pro Arg Ala Lys Tyr Leu 
485 _ 490 495 

ATC AGC AAG CTT TCT AAA ATT TGG GTT TTT TAC ATT TTT TTA TCT TTT 
He Ser Lys Leu Ser Lys He Trp Val Phe Tyr He Phe Leu Ser Phe 
500 505 510 

GTG GTG ATA GGG GGG TTA GTG TGG TTT ATG CAC AAC GCC ATT AAA AGC 
Val Val He Gly Gly Leu Val Trp Phe Met His Asn Ala He Lys Ser 
515 520 525 

ACT CAA GAC AAC GCG TCC AGT TTG ACG ATC CAA GAA AGG CTC TAC CGC 
Thr Gin Asp Asn Ala Ser Ser Leu Thr He Gin Glu Arg Leu Tyr Arg 
530 535 540 545 

CAT GAA ATC ATC CGC TTA CAG GTT AAG ACT GAT GAA ACC TTA AAA CTC 
His Glu He He Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
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ATT AAA GAA GCC 
lie Lys Glu Ala 
565 



550 

AAA AAG CGT TTG 
Lys Lys Arg Leu 



555 

AAT TAT AAC GAT 
Asn Tyr Asn Asp 
570 



560 

GAT ATA CGA GAT 
Asp lie Arg Asp 
575 



GTT TTG CAA GGG CTT TTG AAT ATT GTG CCG GAT TCC ATC ACT ATT AAT 
Val Leu Gin Gly Leu Leu Asn lie Val Pro Asp Ser lie Thr lie Asn 
580 585 590 

AGC ATT GAA ATA GAC CAG CAA AGC GTA GTG GTT AGT GGT AAA ACC CCT 
Ser lie Glu lie Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
595 600 605 

TCT AAA GAA GCC TTT TAT TTT TTG TTT CAA AAC AAA CTA AAC CCC ATG 
Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
610 615 620 625 



TTT GAT TAT TCT AGG GCG GAA TTT TTC CCT TTA AGC GAC GGG TGG TTT 
Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
630 635 640 



T TTT GTC TCC ACC pj^Q TTT TCT AAT TCC TTA CTG ATA AAA AAT CCG 
Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu lie Lys Asn Pro 
645 650 655 



GAG TCT ATT AAA TGA 
Glu Ser lie Lys * 
660 



(2) ANGABEN ZU SEQ ID NO: 64: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 181 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 64: 

Met Lys Ser Met Arg Phe Ser Tyr lie Glu Pro Arg Ala Lys Tyr Leu 
15 10 15 

e Ser Lys Leu Ser Lys lie Trp Val Phe Tyr lie Phe Leu Ser Phe 
20 25 30 

Val Val lie Gly Gly Leu Val Trp Phe Met His Asn Ala lie Lys Ser 
35 40 45 

Thr Gin Asp Asn Ala Ser Ser Leu Thr lie Gin Glu Arg Leu Tyr Arg 
50 55 60 

His Glu lie lie Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
65 70 75 80 

lie Lys Glu Ala Lys Lys Arg Leu Ash Tyr Asn Asp Asp lie Arg Asp 
85 90 95 



Val Leu Gin Gly Leu Leu Asn lie Val Pro Asp Ser lie Thr lie Asn 
100 105 110 
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Ser lie Glu lie Asp . Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
115 120 125 

Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
130 135 140 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
145 150 155 160 

Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu lie Lys Asn Pro 
165 170 175 

Glu Ser lie Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 65: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 174 6 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPS013 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1746 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 65: 

ATG AAA AAA TTG GTT TTA GTC ATC TTT TTA ACG CTA GCG CTT TCA ATA 48 

Met Lys Lys Leu Val Leu Val lie Phe Leu Thr Leu Ala Leu Ser lie 

185 190 195 

TCT GCA AAA GAA GTC AAA ATA GTG TTT TTA GAA ACT TCA GAC ATT CAT 96 

Ser Ala Lys Glu Val Lys lie Val Phe Leu Glu Thr Ser Asp lie His 
200 205 210 

3G CGG CTT TTT TCG TAT GAT TAT GCG ATT GGC GAG CAA AAA CCC AAT 144 

Ly Arg Leu Phe Ser Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 
215 220 225 

AAC GGC TTG ACA AGG ATT GCG ACT TTA ATC AAA AAG CAA AGG GCT GAG 192 

Asn Gly Leu Thr Arg lie Ala Thr Leu lie Lys Lys Gin Arg Ala Glu 
230 235 240 245 

AAT AAA AAT GTG GTT TTG ATT GAC AGC GGG GAT TTG TTG CAA GGC AAT 240 

Asn Lys Asn Val Val Leu lie Asp Ser Gly Asp Leu Leu Gin Gly Asn 
250 255 260 

AGC GCG GAG TTG TTT AAT GAT GAG CCA ATT CAT CCG CTA GTT AGA GCT 288 

Ser Ala Glu Leu Phe Asn Asp Glu Pro lie His Pro Leu Val Arg Ala 

265 270 275 

GAA AAC GAT TTG AAA TTT GAC ATT CGT GTG CTT GGC AAT CAC GAG TTT 3 36 

Glu Asn Asp Leu Lys Phe Asp lie Arg Val Leu Gly Asn His Glu Phe 
280 285 290 
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AAT TTC AGT AAA GAT TTT TTA GAA AAG AAT ATT AAG GGG TTT AAT GGC 384 
Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn lie Lys Gly Phe Asn Gly 
295 300 305 

GAT GTC ATG AAT GCG AAT ATC ATT AAA ATT GCG GAC AAT AAG CCG TTT 432 
Asp Val Met Asn Ala Asn lie lie Lys He Ala Asp Asn Lys Pro Phe 
310 315 320 325 

GTA AAA CCT TAT ATT ATT AAA AAA ATT GAT GGC GTG AGG GTG GCG GTT 480 
Val Lvs Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
330 335 340 

GTG GGG TAT GTG GTG GCG CAC ATC CCA ACT TGG GAG GCC TCT ACG CCT 528 
Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
345 350 355 

GAA CAT TTT GCA GGA TTG AAG TTT TTG GAC GCT GAA GAA GCG TTA AAA 576 
Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
360 365 370 

AG ACC TTA AAA GAG TTG AAA GGG AAG TAT GAT ATT TTG ATT GGC GCT 624 
ivs Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
f 375 380 385 

TTT CAT TTG GGG CGA GAA GAT GAG AAA GGT GGC GAC GGG ATA CCG GAT 672 
Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
390 395 400 405 

TTA GCG AAA AAA TTC CCG CAA TTT GAC ATC ATT TTT GCA GGG CAT GAG 720 
Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
410 415 420 

CAT GCG GTT TAT AAC ACC AAA GTA GGG AAA GTG CAT ACC ATT GAG CCT 768 
His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
425 430 435 

GGA GCG TAT GGG GCT TAT CTG GCA AAG GGC GTG GTG GTA TTT GAC ACT 816 
Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
440 445 450 

AAA ACG AAG AAA AAA ATT ATA ACG ACT GAA AAT TTA CCC ACA AAA GAT 864 
Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
455 460 465 

px'G CCA GAA GAT GAA GAA TTA GCG AAA AAA TAC GAA TAT GTG GAT AAA 912 
al Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
470 475 _ 480 485 

AAA TCA AAA GAA TAC GCT AAT GAA GTG GTT GGC GAA GTT ACA AAA ACC 960 
Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
490 495 500 

TTT ATT GAC AGG CCT GAT TTT ATC ACA GGA GAA GAA AAA ATC ACC ACG 1008 
Phe He Asp Arg Pro Asp Phe He Thr Gly Glu Glu Lys He Thr Thr 
505 510 515 

ATG CCC ACC GCC GCC TTG CAA GAA ACA CCG GTG ATA GAA TTG ATT AAT 1056 
Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
520 525 530 

AAA GTG CAA AAA TAT TAC GCA AAA GCC GAT GTT TCA GCG GCA GCC TTA 1104 
Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 



535 



540 



545 



TTC AAT TTT GGG GCG AAT TTG AAA AAA GGG CCT TTC AAA AGA AAA GAT 
Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
550 555 560 565 

GTC ACT TAT ATT TAC AAG TTC GCT AAT ACG CTC ATT GGA GTG CGT ATA 
Val Thr Tyr lie Tyr Lys Phe Ala Asn. Thr Leu lie Gly Val Arg He 
570 575 580 

ACG GGT GAA AAT CTG TTG AAA TAC ATG GAA TGG TCA TAC CGA TTT TAC 
Thr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
585 590 595 

AAT CAG TTG CAA CCA GGA GAT TTG ACG ATC AGT TTT AAT GAA AAC ATT 
Asn Gin Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He 
600 605 610 

CGC GGC TAT AAC TTT GAT ATG TTT TCT GGC GTG AAA TAC CAG GTT GAT 
Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
615 620 625 




T ACA AAA CCC GCC GGA CAA AGG ATT ATC AAT CCG ACA ATC AAC AAC 
al Thr Lys Pro Ala Gly Gin Arg lie He Asn Pro Thr He Asn Asn 
630 635 640 645 

AAA CCC ATT GAC CCC AAA GCC ATC TAT AAA TTA GCG ATC AAC AAT TAC 
Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
650 655 660 

CGA TTC GGA ACA TTA TCC ACG ACA TTG AAT TTG GTT ACA GAC GCT GAT 
Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
665 670 675 

AGG TAT TAT AAT TCT TAC GAT GAA CTG CAA GAT AAT GGG CAA ATA CGA 
Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
680 685 690 

GAT TTG ATC ATC AAA TAC ATC ACG GAA GAA AAA GGT GGG AAG GTA ACC 
Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
695 700 705 

£CT GAA TTG GAG GGT AAT TGG GAA ATC ATC AAC TAC GAT TTC AAA AAC 
o Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
0 715 720 725 

CCG TTG TTG GAA AAA TTG AGA GAA AAA TTA AAA GAG GGG AGC ATC AAA 
Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
730 735 740 

ATC CCC ACC TCA AAG GAT GGG AGG ACT TTG AAT GTC AAA TCC ATT AAA 
He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
745 750 755 

GAG AGT GAA GTT AAA TAA 
Glu Ser Glu Val Lys * 
760 



(2) ANGABEN ZU SEQ ID NO: 66: 



( i ) SEQUENZKENNZEICHEN : 
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(A) LANGE: 582 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 66: 

Met Lys Lys Leu Val Leu Val lie Phe Leu Thr Leu Ala Leu Ser lie 
15 10 15 

Ser Ala Lys Glu Val Lys lie Val Phe Leu Glu Thr Ser Asp lie His 
20 25 30 

Gly Arg Leu Phe Ser Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 
35 40 45 

Asn Gly Leu Thr Arg lie Ala Thr Leu He Lys Lys Gin Arg Ala Glu 
50 55 60 

Asn Lys Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 
65 70 75 80 

er Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 
85 90 95 

Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His Glu Phe 
100 105 110 

Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn He Lys Gly Phe Asn Gly 
115 120 125 

Asp Val Met Asn Ala Asn He He Lys He Ala Asp Asn Lys Pro Phe 
130 135 140 

Val Lys Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
145 150 155 160 

Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
165 170 175 

Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
180 185 190 

s Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
195 200 205 

Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
210 215 220 

Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
225 230 235 240 

His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
245 250 255 

Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
260 265 270 

Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
275 280 285 

Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
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290 295 300 

Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
305 310 315 320 

Phe lie Asp Arg Pro Asp Phe lie Thr Gly Glu Glu Lys lie Thr Thr 
325 330 335 

Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
340 345 350 

Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
355 360 365 

Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
370 375 380 

Val Thr Tyr He Tyr Lys Phe Ala Asn Thr Leu He Gly Val Arg He 
385 390 395 400 

'hr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
405 410 415 

Asn Gin Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He 
420 425 430 

Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
435 440 445 

Val Thr Lys Pro Ala Gly Gin Arg He He Asn Pro Thr He Asn Asn 
450 455 460 

Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
465 470 475 480 

Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
485 490 495 

Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
500 505 510 

Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
515 520 525 

o Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
530 535 540 

Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
545 550 555 560 

He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
565 570 575 

Glu Ser Glu Val Lys * 
580 

(2) ANGABEN ZU SEQ ID NO: 67: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1698 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
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(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPS024 (HPS025) 

(ix) MERKMAL: 

(A) NAME / S CHLUS S EL : CDS 

(B) LAGE : 1 . .1698 





(xi) SEQUEN2BESCHREIBUNG : SEQ ID NO: 67: 

ATG ATG TTT TCT TCA ATG TTT GCT TCG TTG GGG ACT CGT ATC ATG CTG 
Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
585 590 595 

GTC GTG TTA GCC GCT CTT TTA GGT TTA GGG GGG CTT TTT ATT GGT TTT 
Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
600 605 610 

\TA AAG GTT ATG CAA AAA GAT GTG TTA GCG CAA CTC ATG GAG CAT TTA 
al Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
615 620 625 630 

GAA ACC GGG CAA TAC AAA AAG CGT GAA AAA ACG CTC GCT TAC ATG ACA 
Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
635 640 645 

AAA ATT ATT GAA CAG GGC ATT CAT GAG TAT TAC AAA AAT TTT GAC AAT 
Lys lie lie Glu Gin Gly lie His Glu Tyr Tyr Lys Asn Phe Asp Asn 
650 655 660 

GCT ACT GCA AGA AAA ATG GCG TTA GAT TAT TTC AAA CGC ATC AAC GAC 
Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg lie Asn Asp 
665 670 675 

GAT AAG GGC ATG ATT TAT ATG GTG GTG GTG . GAT . AAA AAC GGG GTG GTA 
Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
680 685 690 

TTG TTT GAT CCG GTC AAT CCT AAA ACC GTA GGC CAA TCA GGG CTT GAC 
u Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
5 700 705 710 

GCT CAG AGC GTT GAT GGG GTG TAT TAT GTT AGG GGG TAT TTG GAG GCG 
Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
715 720 725 

GCC AAA AAA GGG GGA GGC TAC ACT TAT TAT AAA ATG CCT AAA TAC GAT 
Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
730 735 740 

GGA GGC GTA CCG GAG AAA AAA TTC GCC TAC TCG CAT TAT GAT GAA GTT 
Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
745 750 755 

TCT CAA ATG GTG ATC GCA ACG ACT TCC TAT TAC ACT GAC ATT AAC ACA 
Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
760 765 770 
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GAA AAT AAA GCG ATC AAA GAA GGC GTG AAT AAG GTT TTT GAT GAA AAC 624 
Glu Asn Lys Ala He Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
775 780 785 790 

ACC ACG AAA TTA TTC CTT TGG ATA CTG ACA GCG ACG ATA GCG CTA GTG 672 
Thr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
795 800 805 

GTT TTG ACG CTC ATA TAC GCT AAA TTA AGG ATC GTG AAA CGC ATT GAT 720 
Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
810 815 820 

GAA CTG GTC CTT AAA ATC AAC GCT TTT AGC CGT GGG GAT AAG GAT TTG 768 
Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
825 830 835 

AGA GCC AAA ATT GAT GTG GGT GAT CGC AAC GAT GAA ATC TCG CAA GTG 816 
Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
840 845 850 

.GGC CGT GGG ATC AAT TTG TTT GTG GAA AAC GCC CGC TTG ATT ATG GAA 864 
ly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
55 860 865 870 

GAG ATT AAA GGG ATT TCC ACC CTC AAT AAA ACT TCA ATG GAT AAA TTA 912 
Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
875 880 885 

GTC CAA ATC ACG CAA GAA ACC CAA AAG AGC ATG AAA GAT TCC TCA ACC 960 
Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
890 895 900 

ACC CTA AAT TCC GTG AAA AAT AAA GCC ACT GAT ATA GCG AGC ATG ATG 1008 
Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
905 910 915 

AAT GCT TCC ATA GAG CAA TCT CAA GGG TTA AGG AAG CGT TTG ATT GAA 1056 
Asn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
920 925 930 

ACG CAA GGG CTG GTC AAA GAG AGC AAG GAT GCG ATC GGG GAT TTA TTT 1104 
Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
935 940 945 950 

T CAA ATC ACA GAG AGC GCG CAC ACT GAA GAG GAA CTC TCT AGC AAA 1152 
r Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
955 960 965 

GTG GAG CAG CTA AGC CGT AAC GCT GAT GAT GTC AAA TCC ATT CTG GAT 1200 
Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
970 975 980 

ATT ATC AAT GAT ATT GCC GAT CAA ACG AAT TTA TTA GCC CTA AAC GCT 1248 
He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
985 990 995 

GCT ATT GAA GCC GCA AGG GCT GGC GAG CAT GGC AGA GGC TTT GCG GTG 1296 
Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
1000 1005 1010 

GTG GCT GAT GAA GTT AGG AAT TTA GCC GGG CGC ACT CAA AAG TCT TTA 1344 
Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
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^^^lu 



1015 1020 1025 1030 

GCC GAA ATC AAT TCC ACT ATC ATG GTG ATT GTC CAA GAA ATC AAT GCC 13 92 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
1035 1040 1045 

GTG AGT TCG CAA ATG AAT CTC AAT TCG CAA AAA ATG GAG CGT TTG AGC 1440 
Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
1050 1055 1060 

GAT ATG AGT AAA AGC GTG CAA GAA ACT TAC GAA AAA ATG AGT TCT AAT 1488 
Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
1065 1070 1075 

TTA AGC TCA GTC GTG TCA GAC AGC AAT CAA AGC ATG GAC GAT TAC GCC 1536 
Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
1080 1085 1090 

AAA TCC GGA CAC CAA ATT GAA GTT ATG GTA AGC GAT TTT GCA GAG GTG 1584 
Lys Ser Gly His Gin lie Glu Val Met Val Ser Asp Phe Ala Glu Val 
095 1100 1105 1110 



AAA GTG GCT TCT AAG ACT TTA GCG GAT TCT TCA GAT ATT TTA AAC 1632 
r Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
1115 1120 1125 

ATC GCT ACG CAT GTG AGT GGA ACG ACC ATG AAT TTA GAC AAA CAA GTG 1680 
lie Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
1130 1135 1140 

AAT TTG TTT AAA ACT TAA 1698 
Asn Leu Phe Lys Thr * 
1145 




(2) ANGABEN ZU SEQ ID NO: 68: 

( i ) SEQUENZ KENNZE I CHEN : 

(A) LANGE: 566 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 68: 

fet Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
1 5 10 15 

Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
20 25 30 

Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
35 40- 45 

Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
50 55 60 

Lys lie lie Glu Gin Gly lie His Glu Tyr Tyr Lys Asn Phe Asp Asn 
65 70 75 80 

Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg lie Asn Asp 
85 90 95 
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Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
100 105 110 

Leu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
115 120 125 

Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
130 135 140 

Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
145 150 155 160 

Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
165 170 175 

Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
180 185 190 

Glu Asn Lys Ala He Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
195 200 205 

hr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
210 215 220 

Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
225 230 235 240 

Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
245 250 255 

Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
260 265 270 

Gly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
275 280 285 

Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
290 295 300 

Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
305 310 315 320 

Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
325 330 335 

r sn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
340 345 350 

Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
355 360 365 

Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
370 375 380 

Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
385 390 395 400 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
405 410 415 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
420 425 430 
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Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
435 440 445 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
450 455 460 

Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
465 470 475 480 

Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
485 490 495 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
500 505 510 

Lys Ser Gly His Gin lie Glu Val Met Val Ser Asp Phe Ala Glu Val 
515 520 525 

Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
530 535 540 

le Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
45 550 555 560 

Asn Leu Phe Lys Thr * 
565 

(2) ANGABEN ZU SEQ ID NO: 69: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 855 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS036 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .855 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 69: 

TTG GGT ATC AAT ATG TGT TCT AAA AAA ATA AGA AAT CTC ATT TTA TGC 4 8 

Leu Gly lie Asn Met Cys Ser Lys Lys lie Arg Asn Leu lie Leu Cys 
570 575 580 

TTT GGT TTT ATG TTG GGC TTG CAC GCT GAA GAA AAT ACG ACT GAA GGA 96 
Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
585 590 595 

AAT ATG ACT GAA GAA AAT ATC TCT AAA GAC GCT CCC ATT CTT TTG GAA 144 
Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
600 605 610 

GAA AAA CGC GCC CAA ACG CTA GAA TTT AAA GAA GAA AAG GAA GCT AAA 192 
Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
615 620 625 630 
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AAG AAT ATT GAT GAA AAA AGC CTG CTT GAA GAA ATC CAT AAG AAA AAA 240 
Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
635 640 645 

CGC CAA CTT TAC ATG CTC AAA GGG GAA TTG CAT GAA AAA AAT GAA TCT 288 
Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
650 655 660 

CTC TTG TTC CAA CGA ATG GCT AAA AAT AAG AGC GGT TTT TTT ATA GGC 336 
Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
665 670 675 

GTA ATC CTT GGC GAT ATA GGG GTT AGC GCT CAT TCT TAT GAG AAG TTT 384 
Val lie Leu Gly Asp lie Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
680 685 690 

GAA CTT TTA AGC AAT ATT CAA GCT TCT CCT TTG TTG TAT GGC TTA AGG 432 
Glu Leu Leu Ser Asn lie Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
695 700 705 710 

GC GGG TAT CAA AAG TAT TTT GCT AAC GGG ATT AGC GCC TTA CGC TTT 480 
jer Gly Tyr Gin Lys Tyr Phe Ala Asn Gly lie Ser Ala Leu Arg Phe 
715 720 725 

TAT GGG GAG TAT TTA GGG GGG GCG ATG AAA GGA TTT AAA AGC GAT TCT 528 
Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
730 735 740 

TTA GCC TCT TAT CAA ACC GCA AGC TTG AAC ATT GAT TTG TTG ATG GAT 576 
Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
745 750 755 

AAG CCT ATT GAC AAA GAA AAA AGG TTT GCG TTA GGG ATA TTT GGA GGC 624 
Lys Pro lie Asp Lys Glu Lys Arg Phe Ala Leu Gly lie Phe Gly Gly 
760 765 770 

GTT GGA GTG GGG TGG AAT GGG ATG TAT CAA AAT TTA AAA GAG GTT AAA 672 
Val Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
775 780 785 790 

GGG TAT TCA CAG CCT AAC GCT TTT GGA TTA GTG CTA AAT TTA GGG GTG 720 
Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
795 800 805 



C ATG ACG CTT AAC CTC AAA CAC CGC TTT GAA TTA GCC TTA AAA ATG 768 
fer Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
810 815 820 

CCT CCC TTA AAA GAA ACT TCG CAA ACC TTT TTA TAT TAT TTT AAA AGC 816 
Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
825 830 835 

ACT AAT ATT TAT TAT ATT AGT TAC AAC TAT TTA TTG TAA 855 
Thr Asn lie Tyr Tyr lie Ser Tyr Asn Tyr Leu Leu * 
840 845 850 



(2) ANGABEN ZU SEQ ID NO: 70: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 2 85 Aminosauren 

(B) ART: Aminosaure 
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(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 70: 

Leu Gly lie Asn Met Cys Ser Lys Lys lie Arg Asn Leu lie Leu Cys 
15 10 15 

Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
20 25 30 

Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
35 40 45 

Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
50 55 60 

Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
65 70 75 80 



e 1 



g Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
85 90 95 



eu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
100 105 110 

Val lie Leu Gly Asp lie Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
115 120 125 

Glu Leu Leu Ser Asn lie Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
130 135 140 

Ser Gly Tyr Gin Lys Tyr Phe Ala Asn Gly lie Ser Ala Leu Arg Phe 
145 150 155 160 

Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
165 170 175 

Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
180 185 190 

Lys Pro lie Asp Lys Glu Lys Arg Phe Ala Leu Gly lie Phe Gly Gly 
195 200 205 

1 Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
210 215 220 

Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
225 230 235 240 

Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
245 250 255 

Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
260 265 270 

Thr Asn lie Tyr Tyr lie Ser Tyr Asn Tyr Leu Leu * 
275 280 285 

(2) ANGABEN ZU SEQ ID NO: 71: 

(i) SEQUENZKENNZEICHEN: 



(A) LANGE: 669 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS038 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..669 




(xi) SEQUEN2BESCHREIBUNG : SEQ ID NO: 71: 

ATG GCT GAA AAT TCT TTC AAA AAT GTT TCC ACA CAA CCC AAA GTA TTT 
Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
290 295 300 

(TC TTA TTG CCA GCT AAA ACC CTG TTT CTT TTA GGA GGC GTT TTT AGC 
tie Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
305 310 315 

GCG TTT TTT ATC CTT ATT GCT GGC TTG GTT TTT TTT GAT TAT GCT CAT 
Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
320 325 330 

TTG ATG GAC AAT GCC ATT TTT AAT TTT GCG CGT TCA ACC CCC TTT AAT 
Leu Met Asp Asn Ala lie Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
335 340 345 

TCC AGC CCT ATT TTA ACT CTA ATC CTC CAA AAT ATC GCT AAT TTA GGC 
Ser Ser Pro lie Leu Thr Leu lie Leu Gin Asn lie Ala Asn Leu Gly 
350 355 360 365 

TCT TCT CAA TTC GTG TTG CCT TTG AGT TTG TTG GTG GGG GTG TTT TTA 
Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
370 375 380 



AGC CTT TAT CGC AGA AAC TTA GTG CTT GGG GTG TGG TTT GTG TTA AGC 
Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
385 390 395 



'G ATC TTG TTT GAA GCC CTT TTA GAA TCT TTA AAA CAC CTT TTT GCA 

Val lie Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 

400 " 405 410 

TAT TCC ATT CAG TGG CTT TCG CGC AGC GCT AAT TTC CCT AAC GCT ACT 

Tyr Ser lie Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
415 420 425 

GCG CTT TCT TTA GTG CTA TTT TAT GGG TTG CTT ATT TTA TTG ATA CCC 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu lie Leu Leu lie Pro 
430 435 440 445 

CAT TTA ATC ACG CAT CAA ACG CTT AAA AAT GTT CTT TTT TAT AGC TTA 

His Leu lie Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
450 455 460 



TTT GGT TTG ATT TTT TTA ATA GGG TTA GCA CTG ATT GTT TTA GGG GTT 
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Phe Gly Leu lie Phe Leu lie Gly Leu Ala Leu lie Val Leu Gly Val 
465 470 475 

TCT TTC AGT AGT GTT TTA GGA GGG TTT TGT TTA GGG GCG TTA GGG GCT 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
480 485 490 

TGT TTT TCC ATA GGG ATT TAT TTG AGC GTG TTT CAA AAG ATC TAA 

Cys Phe Ser lie Gly lie Tyr Leu Ser Val Phe Gin Lys lie * 
495 500 505 



(2) ANGABEN ZU SEQ ID NO: 72: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 223 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 72: 

et Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
15 10 15 

Phe Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
20 25 30 

Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
35 40 45 

Leu Met Asp Asn Ala lie Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
50 55 60 

Ser Ser Pro lie Leu Thr Leu lie Leu Gin Asn lie Ala Asn Leu Gly 
65 70 75 80 

Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
85 90 95 

Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
100 105 110 



1 lie Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
115 120 125 



Tyr Ser lie Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
130 135 140 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu lie Leu Leu lie Pro 
145 150 155 160 

His Leu lie Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
165 170 175 

Phe Gly Leu lie Phe Leu lie Gly Leu Ala Leu lie Val Leu Gly Val 
180 185 190 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
195 200 205 

Cys Phe Ser lie Gly lie Tyr Leu Ser Val Phe Gin Lys lie * 



210 



215 



220 



(2) ANGABEN ZU SEQ ID NO: 73: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 804 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 




(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS039 (HPS147) 

( ix) MERKMAL : 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .804 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 73: 



TG TCA GAA AAA GAA AGA CTG AAT GAA GTG ATC TTA GAA GAA GAA AAT 
Met Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
225 230 235 

AAT GGG AGC GGC ACT AAA AAG GTG TTT TTG ATC GTG GCT ATA GCC ATT 
Asn Gly Ser Gly Thr Lys Lys Val Phe Leu lie Val Ala lie Ala lie 
240 245 250 255 

ATC ATT TTA GCG GTG CTT TTA ATG GTG TTT TGG AAA AGC ACG AGA GTC 
lie lie Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
260 265 270 

GCT CCT AAA GAG ACT TTT TTA CAA ACC GAT AGC GGC ATG CAA AAA ATA 
Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys lie 
275 280 285 

GGC AAC ACT AAA GAC GAG AAA AAA GAC GAT GAG TTT GAA AGC TTG AAT 
Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
290 295 300 



^^^^ 



TG GAT CCT TCC AAG CAA GAA GAC AAG CTA GAC AAA GTG GCG GAT AAT 
u Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
305 310 315 



GTT AAG AAG CAA GAA AAT GAT GCG TTT AAC ATG CCC ACT CAA ACC GAT 
Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
320 325 330 335 

CAA ACT CAA ACG GAG ATG AAA ACA ACA GAA GAA ACG CAA GAA GCT CAA 
Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
340 345 350 

AAA GGA TTA AAA GTT GTT GAG CAC ACT AGC ACT CAA AAA GAA TCT CAA 
Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
355 360 365 

GCT GTG GCT AAA AAA GAA ATC TCC CAT AAA AAG CCT AAA GCA ACC CCT 
Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
370 375 380 
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AAA GAT AAG GAA GCC CAT AAA GAT AAA GAT AAG CAT GCG GTT AAA GAG 
Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
385 390 395 

CTA AAA GTC AAA AAA GAA GCT CAT AAA GAA GTT CCT AAA AAA GCC AAT 
Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
400 405 410 415 

TCT AAA ACC ACT CTT ACT AAA GGG CAT TAT TTG CAA GTG GGG GTT TTT 
Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
420 425 430 

GCG CAC ACG CCC AAT AAA GCC TTT TTG CAA GCG TTT AAC CAA TTC CCC 
Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
435 440 445 

CAT AAG ATT GAA GAT AGG GGG TCT ACT AAA CGC TAT CTC ATA GGC CCT 
His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
450 455 460 



^^TA 



'AT AAG AAT AAG CAA GAA GCC TTA ATG CAT GCT GAT GAA GTC AGC AAA 
r Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
465 470 475 . 



AAG ATG ACT AAA CCG GTT GTC ATA GAA GCG CGG TAG 
Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
480 485 490 



(2) ANGABEN ZU SEQ ID NO: 74: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 268 Amino sauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 74: 



Met Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
15 10 15 



i 



sn Gly Ser Gly Thr Lys Lys Val Phe Leu lie Val Ala lie Ala lie 
20 25 30 



le lie Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
35 _ 40 45 

Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys lie 
50 55 60 

Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
65 70 75 80 

Leu Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
85 90 95 

Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
100 105 110 



Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
115 120 125 
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Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
130 135 140 

Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
145 150 155 160 

Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
165 170 175 

Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
180 185 190 

Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
195 200 205 

Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
210 215 220 

His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
225 230 235 240 



Lys. Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
245 250 255 



Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
260 265 

(2) ANGABEN ZU SEQ ID NO: 75: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1545 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) XJNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPS040 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1545 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 75: 

GTG AGG CAA GAA AAG TAT TTT CTG ACT TCT TCT TTA TCG CTT TTA TCG 48 
Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
270 275 280 

TTT TTA TTA TGT CCT GCA GAA GCT TTT GAT TAT CGC TTT AGC GGT CGT 96 
Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
285 290 295 300 

GTG GAG AAC TTT TCT AAG ATT GGT TTT AAC AAT TCT CAA ATC AAT ACT 144 
Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin lie Asn Thr 
305 310 315 

AAA AAA GGG ATT TAT CCT ACT GAA AGT TTT ATA GAT ATT GTA ACT TTA 192 
Lys Lys Gly lie Tyr Pro Thr Glu Ser Phe lie Asp lie Val Thr Leu 
320 325 330 



GCG CAA GTC AAA GTC AAT TTA CTC CCT AAA GGC ACC GAA AAC CAT AGG 
Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
335 340 345 

CTC TCT GTC TCT TTG GGT GGG GCG ATT GCA GCC ATT CCT TAT GAT AAG 
Leu Ser Val Ser Leu Gly Gly Ala lie Ala Ala lie Pro Tyr Asp Lys 
350 355 360 

ACT AAA TAT GAT ATT AAC CAA GCT AAC GGG AAG ATT TTT GGC TCA ATT 
Thr Lys Tyr Asp lie Asn Gin Ala Asn Gly Lys lie Phe Gly Ser lie 
365 370 375 380 

GTA GAG AAT TTC ATT GGG GGC TAT CAT GGA TAC TTT TTT AAT AAG TAT 
Val Glu Asn Phe lie Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
385 390 395 

CTT GGC CCT GCT TAT GCG GGG ACT TCT CAA TCA GCG AGC TAT CAT GCA 
Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
400 405 410 



.GG CCT TAT GTG GTG GAT ACC GCT TTT TTA CGA TAC GAT TAC AAA GAT 
g Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
415 420 425 



GTT TTT GGG TTT AAG GCG GGG CGC TAT GAA GCG AAT ATT GAT TTC ATG 
Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn lie Asp Phe Met 
430 435 440 

AGC GGA TCG AAT CAA GGG TGG GAA GTG TAT TAT CAG CCC TAT AAG ACT 
Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
445 450 455 460 

GAA ACG CAA AGG TTA AGG TTT TGG TGG TGG AGT TCT TTT GGG AGA GGT 
Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
465 470 475 

TTA GCG TTC AAC TCT TGG ATT TAT GAG TTT TTT GCG ACG GTG CCT TAT 
Leu Ala Phe Asn Ser Trp He Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
480 485 490 

TTG AAA AAG GGA GGC AAT CCT AAT AAC AGC AAC GAT TTC ATC AAT TAT 
Leu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe He Asn Tyr 
495 500 505 



C TGG CAT GGA ATC ACC ACA ACC TAT TCT TAT AAA GGT TTA GAC GCT 

ly Trp His Gly He Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
510 515 520 

CAA TTT TTT TAT TAT TTT GCG CCT AAG ACT TAT AAC GCT CCT GGC TTT 

Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 

525 530 535 540 

AAG CTG GTC TAT GAC ACG AAT AGG AAT TTT CAA AAT GTA GGC TTT CGC 

Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
545 550 555 

TCT CAA AGC ATG ATC ATG ACA ACC TTT CCT TTA TAC TAT AGA GGG TGG 

Ser Gin Ser Met He Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
560 565 570 



TAT AAC CCA GAG ACA AAC ACT TAT AGT TTA GAA GAC AGC ACG CCT CAT 
Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
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575 580 585 

GGC TCG TTG TTG GGG AGG AAT GGC GTT ACT TTA AAT ATC CGC GAG GTT 
Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn lie Arg Gin Val 
590 595 600 

TTT TGG TGG GAT AAT TTC AAC TGG TCC ATT GGC TTT TAT AAC ACC TTT 
Phe Trp Trp Asp Asn Phe Asn Trp Ser lie Gly Phe Tyr Asn Thr Phe 
605 610 615 620 

GGC AAT TCG GAC GCT TTT TTA GGC TCT CAC ACG ATG CCA AGG GGT AAT 
Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
625 630 635 

AAC ACT TCC TAT ATC GGT AGT GAA ATC TCC ATA ACG ACT AGG CAT GCC 
Asn Thr Ser Tyr lie Gly Ser Glu lie Ser lie Thr Thr Arg His Ala 
640 645 650 

GGA ATG ATT GGC TAT GAT TTT TGG GAT AAT ACG GCT TAT GAT GGG CTA 
Gly Met lie Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
655 660 665 

CT GAT GCG ATC ACT AAC GCT AAC ACT TTC ACT TTT TAC ACT TCT GTT 
Ala Asp Ala lie Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
670 675 680 

GGA GGG ATC CAT AAG CGT TTT GCA TGG CAT GTT TTT GGG CGC GTC TCT 
Gly Gly lie His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
685 690 695 700 

CAT GCG AAT AAA AAC GCG TTA GGG CAA GTG GGG AGG GCT AAT GAA TAT 
His Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
705 710 715 

TCC TTG CAA TTC AAC GCG AGC TAT GCG TTC ACT GAA TCA ATC CTT CTT 
Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser lie Leu Leu 
720 725 730 

AAC TTT AGG ATC ACT TAT TAT GGG GCT AGG ATC AAT AAA GGG TAT CAA 
Asn Phe Arg lie Thr Tyr Tyr Gly Ala Arg lie Asn Lys Gly Tyr Gin 
735 740 745 



GCG GGG TAT TTT GGA GCG CCC AAA TTC AAT AAC CCT GAT GGC GAT TTT 
^a Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
750 755 760 



AGC GCT AAT TAC CAA GAC AGA AGT TAC ATG ATG ACC AAC CTC ACG CTG 
Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
765 770 775 780 

AAG TTT TGA 
Lys the * 



(2) ANGABEN ZU SEQ ID NO: 76: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 515 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 76: 

Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
15 10 15 

Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
20 25 30 

Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin lie Asn Thr 
35 40 45 

Lys Lys Gly lie Tyr Pro Thr Glu Ser Phe lie Asp lie Val Thr Leu 
50 55 60 

Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
65 70 75 80 

Leu Ser Val Ser Leu Gly Gly Ala lie Ala Ala lie Pro Tyr Asp Lys 
85 90 95 

hr Lys Tyr Asp lie Asn Gin Ala Asn Gly Lys lie Phe Gly Ser lie 
100 105 110 

Val Glu Asn Phe lie Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
115 120 125 

Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
130 135 140 

Arg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
145 150 155 160 

Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn lie Asp Phe Met 
165 170 175 

Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
180 185 190 

Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
195 200 205 

Leu Ala Phe Asn Ser Trp lie Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
210 215 220 

eu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe lie Asn Tyr 
225 230 235 240 

Gly Trp His Gly lie Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
245 250 255 

Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
260 265 270 

Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
275 280 285 

Ser Gin Ser Met lie Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
290 295 300 

Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
305 310 315 320 
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Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn lie Arg Gin Val 
325 330 335 

Phe Trp Trp Asp Asn Phe Asn Trp Ser lie Gly Phe Tyr Asn Thr Phe 
340 345 350 

Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
355 360 365 

Asn Thr Ser Tyr lie Gly Ser Glu lie Ser lie Thr Thr Arg His Ala 
370 375 380 

Gly Met lie Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
385 390 395 400 

Ala Asp Ala lie Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
405 410 415 

Gly Gly lie His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
420 425 430 

is Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
435 440 445 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser lie Leu Leu 
450 455 460 

Asn Phe Arg lie Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
465 470 475 480 

Ala Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
485 490 495 

Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
500 505 510 

Lys Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 77: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 912 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS048 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..912 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 77: 

ATG AAA AAG ATT ATT CTT GCA TGC CTT ATG GCT TTT GTG GGT GCC AAT 4 8 

Met Lys Lys He He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
520 525 530 
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TTA AGC GCA GAG CCT AAG TGG TAT AGC AAG GCC TAC AAC AAA ACA AAC 

Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 

535 540 545 

ACC CAA AAA GGC TAT CTT TAT GGG AGT GGT TCA GCC ACT TCT AAA GAG 

Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 

550 555 560 

GCT TCT AAA CAA AAA GCG TTA GCG GAT TTA GTG GCG TCT ATT AGC GTG 

Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 

565 570 575 

GTG GTT AAT TCC CAA ATC CAT ATT CAA AAA AGT CGT GTG GAC AAT AAG 

Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 

580 585 590 595 

TTA AAA TCC AGC GAT TCG CAA ACG ATT AAC TTA AAG ACC GAT GAC TTG 

Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 

600 605 610 



GAA TTG AAT AAT GTA GAA ATT GTC AAT CAA GAA GTG CAA AAA GGG ATC 
lu Leu Asn Asn Val Glu lie Val Asn Gin Glu Val Gin Lys Gly lie 
615 620 625 



TAC TAC ACC AGA GTA AGG ATC AAT CAA AAC TTG TTT TTG CAG GGT TTA 
Tyr Tyr Thr Arg Val Arg lie Asn Gin Asn Leu Phe Leu Gin Gly Leu 
630 635 640 

AGG GAT AAG TAT AAC GCT CTT TAT GGG CAG TTT TCC ACC TTA ATG CCT 
Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
645 650 655 

AAG GTT TGT AAA GGG GTT TTT TTA CAG CAA TCC AAG AGC ATG GGG GAT 
Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
660 665 670 675 

TTA TTG GCT AAA GCG ATG CCT ATA GAA AGG ATT TTA AAA GCG TAT TCT 
Leu Leu Ala Lys Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 
680 685 690 

GTT CCG GTG GGT TCG TTA GAA AAT TAT GAA AAA ATC TAT TAT CAA AAC 
Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys lie Tyr Tyr Gin Asn 
695 700 705 



!T TTC AAA CCT AAA GTG CAA ATC ACT TTT GAT AAC AAC GGC GAT GCG 
la Phe Lys Pro Lys Val Gin lie Thr Phe Asp Asn Asn Gly Asp Ala 
710 715 720 

GAA ATC AAA AGC GCT CTC ATA AGC GCT TAT GCC AGA GTG CTA ACC CCT 
Glu lie Lys Ser Ala Leu lie Ser Ala Tyr Ala Arg Val Leu Thr Pro 
725 730 735 

AGT GAT GAA GAA AAA CTC TAT CAA ATC AAA AAT GAA GTT TTC ACA GAC 
Ser Asp Glu Glu Lys Leu Tyr Gin lie Lys Asn Glu Val Phe Thr Asp 
740 745 750 755 

AGT GCT AAT GGC ATC ACG CGC ATT AGA GTG GTT GTT AGC GCG AGC GAT 
Ser Ala Asn Gly lie Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
760 765 770 



TGT CAA GGC ACG CCT GTA TTG AAT AGA AGC CTT GAA GTG GAT GAA AAG 
Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
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775 780 785 

AAT AAG AAT TTT GCT ATC ACG CGC TTA CAA TCT TTG CTT TAT AAA GAA 
Asn Lys Asn Phe Ala lie Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
790 795 800 

CTG AAA GAT TAT GCC AAT AAA GAA GGG CAA GGC AAT ACG GGG TTA TAA 
Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu *. 
805 810 815 

(2) ANGABEN ZU SEQ ID NO: 78: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 304 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 78: 

et Lys Lys lie lie Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
15 10 15 

Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
20 25 30 

Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
35 40 45 

Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 
50 55 60 

Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 
65 70 75 80 

Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 

85 90 95 

Glu Leu Asn Asn Val Glu lie Val Asn Gin Glu Val Gin Lys Gly lie 
100 105 110 



Tyr Tyr Thr Arg Val Arg lie Asn Gin Asn Leu Phe Leu Gin Gly Leu 
115 120 125 



g Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
130 135 140 

Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
145 150 155 160 

Leu Leu Ala Lys Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 
165 170 175 

Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys lie Tyr Tyr Gin Asn 
180 185 190 

Ala Phe Lys Pro Lys Val Gin lie Thr Phe Asp Asn Asn Gly Asp Ala 
195 200 205 

Glu lie Lys Ser Ala Leu lie Ser Ala Tyr Ala Arg Val Leu Thr Pro 
210 215 220 
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Ser Asp Glu Glu Lys Leu Tyr Gin lie Lys Asn Glu Val Phe Thr Asp 
225 230 235 240 

Ser Ala Asn Gly lie Thr Arg lie Arg Val Val Val Ser Ala Ser Asp 
245 250 255 

Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
260 265 270 

Asn Lys Asn Phe Ala lie Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
275 280 285 

Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
290 295 300 

(2) ANGABEN ZU SEQ ID NO: 79: 

(i) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 834 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS050 

( ix) MERKMAL : 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..834 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 79: 

ATG AAA ACA AAC GGG CTT TTT AAA ATG TGG GGG CTG TTT TTA GTT TTA 
Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
305 310 315 320 

ATC GCT TTA GTC TTT AAT GCA TGT TCT GAT AGC CAT AAA GAA AAA AAG 
lie Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
325 330 335 



C GCT TTA GAA GTC ATT AAA CAA AGA GGG GTT TTA AAA GTG GGG GTT 
sp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
340 345 350 

TTT AGC GAT AAG CCT CCT TTT GGC TCT GTG GAT TCT AAA GGG AAA TAT 
Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
355 360 365 

CAA GGC TAT GAT GTA GTT ATT GCT AAA CGC ATG GCT CTT GAT TTA TTG 
Gin Gly Tyr Asp Val Val lie Ala Lys Arg Met Ala Leu Asp Leu Leu 
370 375 380 

GGC GAT GAA AAT AAG ATT GAG TTT ATT CCT GTA GAA GCT TCA GCT AGG 
Gly Asp Glu Asn Lys lie Glu Phe lie Pro Val Glu Ala Ser Ala Arg 
385 390 395 400 



GTG GAA TTT TTA AAA GCC AAT AAA GTG GAT ATT ATC ATG GCT AAT TTC 
Val Glu Phe Leu Lys Ala Asn Lys Val Asp lie lie Met Ala Asn Phe 
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405 410 415 

ACG CGC ACT AAA GAA AGA GAA AAA GTC GTG GAT TTC GCT AAG CCG TAT 
Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
420 425 430 

ATG AAA GTC GCT TTA GGG GTG GTT TCT AAA GAT GGG GTC ATT AAA AAT 
Met Lys Val Ala Leu Gly Val Val .Ser Lys Asp Gly Val lie Lys Asn 
435 440 445 

ATA GAA GAG TTG AAA GAT AAA GAG TTG ATT GTG AAT AAA GGC ACG ACA 
lie Glu Glu Leu Lys Asp Lys Glu Leu lie Val Asn Lys Gly Thr Thr 
450 455 460 

GCG GAT TTT TAT TTC ACT AAA AAT TAC CCC AAT ATC AAG CTT TTG AAA 
Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn lie Lys Leu Leu Lys 
465 470 475 480 

TTT GAG CAA AAT ACA GAG ACT TTT TTA GCC CTT TTA AAC AAT AAG GCT 
Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
485 490 495 




CC GCT CTA GCC CAT GAC AAC ACT TTA TTG CTC GCT TGG ACG AAA CAA 
hr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
500 505 510 

CAC CCT GAA TTT AAA TTA GGC ATT ACA AGC CTT GGC GAT AAG GAT GTG 
His Pro Glu Phe Lys Leu Gly lie Thr Ser Leu Gly Asp Lys Asp Val 
515 520 525 

ATC GCT CCA GCG ATT AAA AAA GGC AAC CCC AAG CTT TTA GAA TGG TTG 
lie Ala Pro Ala lie Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
530 535 540 

AAT AAC GAA ATA GAT TCC CTC ATT TCT AGC GAC TTC TTA AAA GAA GCT 
Asn Asn Glu lie Asp Ser Leu lie Ser Ser Asp Phe Leu Lys Glu Ala 
545 550 555 560 

TAT CAA GAG ACT TTA GCA CCT GTT TAT GGC GAT GAA ATC AAA CCG GAA 
Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu lie Lys Pro Glu 
565 570 575 

GAA ATT ATT TTT GAA TGA 
lu lie lie Phe Glu * 
580 

(2) ANGABEN ZU SEQ ID NO": 80: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 278 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 80: 

Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
15 10 15 

lie Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
20 25 30 



124 




Asp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
35 40 45 

Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
50 55 60 

Gin Gly Tyr Asp Val Val lie Ala Lys Arg Met Ala Leu Asp Leu Leu 
65 70 75 80 

Gly Asp Glu Asn Lys lie Glu Phe lie Pro Val Glu Ala Ser Ala Arg 
85 90 95 

Val Glu Phe Leu Lys Ala Asn Lys Val Asp lie lie Met Ala Asn Phe 
100 105 110 

Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
115 120 125 

Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val lie Lys Asn 
130 135 140 

le Glu Glu Leu Lys Asp Lys Glu Leu lie Val Asn Lys Gly Thr Thr 
45 150 155 160 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn lie Lys Leu Leu Lys 
165 170 175 

Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
180 185 190 

Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
195 200 205 

His Pro Glu Phe Lys. Leu Gly lie Thr Ser Leu Gly Asp Lys Asp Val 
210 215 220 

lie Ala Pro Ala lie Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
225 230 235 240 

Asn Asn Glu He Asp Ser Leu lie Ser Ser Asp Phe Leu Lys Glu Ala 
245 250 255 

Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
260 265 270 

lu He He Phe Glu * 
275 

(2) ANGABEN ZU SEQ ID NO: 81: 

(i) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1296 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS052 



<ix) MERKMAL: 
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(A) NAME/SCHLUSSEL: CDS 

(B) LAGE ; 1 . .1296 





(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 81: 

GTG GCG TTA GCT GAA GAC GAT GGC TTT TAT ATG GGA GTG GGC TAT CAA 48 
Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
280 285 290 

ATC GGC GGC GCG CAA CAA AAT ATC GAT AAC AAA GGC AGC ACC CTA AGG 96 
lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
295 300 305 310 

AAT AAT GTC ATT AAT AAT TTC CGC CAA GTG GGC GTG GGT ATG GCA GGG 144 
Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
315 320 325 

GGT AAT GGG CTT TTA GCC TTA GCG ACA AAC ACG ACC ATG GAC GCT CTT 192 
Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
330 335 340 

TA GGG ATA GGC AAC CAA ATT GTC AAT ACT AAT ACA ACT GTT AGC AAC 240 
eu Gly lie Gly Asn Gin lie Val Asn Thr Asn Thr Thr Val Ser Asn 
345 350 355 

AAC AAC GCA GAA TTA ACC CAG TTT AAA AAA ATA CTC CCT CAA ATT GAG 288 
Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys lie Leu Pro Gin lie Glu 
360 365 370 

CAA CGC TTT GAA ACG AAT AAA AAC GCT TAT AGC GTT CAA GCC TTG CAA 336 
Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
375^- 380 385 390 

GTG TAT TTG AGT AAT GTG CTT TAT AAC TTG GTT AAT AAT AGT AAT AAT 3 84 

Val Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
395 400 405 

GGC AGT AAT AAT GGA GTC GTT CCT GAA TAT GTA GGA ATT ATA AAA GTT 432 
Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly lie lie Lys Val 
410 415 420 

CTC TAT GGT TCT CAA AAT GAA TTC AGT CTC TTA GCC ACG GAG AGT GTG 480 
eu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
425 430 435 

GTG CTT TTA AAC GCG CTT ACA AGG GTG AAT CTG GAT AGT AAT TCG GTG 528 
Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
440 445 450 

TTT TTA AAA GGG CTA TTA GCC CAA ATG CAG CTT TTT AAT GAC ACT TCT 576 
Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
455 460 465 470 

TCA GCA AAG CTA GGC CAG ATC GCA GAA AAC TTG AAG AAC GGT GGT GCA 624 
Ser Ala Lys Leu Gly Gin lie Ala Glu Asn Leu Lys Asn Gly Gly Ala 
475 480 485 

GGA TCA ATG CTC CAA AAG GAT GTG AAA ACC ATC TCG GAT CGA ATC GCT 672 
Gly Ser Met Leu Gin Lys Asp Val Lys Thr lie Ser Asp Arg lie Ala 
490 495 500 
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ACT TAC CAA GAG AAT CTA AAA CAG CTA GGA GGG ATG CTA AAG AAT TAC 
Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
505 510 515 

GAT GAA CCC TAC TTG CCC CAA TTT GGG CCA GGC ACA AGC TCT CAG CAT 
Asp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
520 525 530 

GGG GTT ATT AAT GGC TTT GGC ATT CAA GTG GGC TAT AAG CAA TTT TTT 
Gly Val lie Asn Gly Phe Gly lie Gin Val Gly Tyr Lys Gin Phe Phe 
535 540 545 550 

GGG AAC AAG CGG AAT ATA GGC TTA CGA TAT TAC GCT TTC TTT GAT TAT 
Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
555 560 565 

GGC TTT ACG CAA TTG GGC AGT CTT AGC AGC GCC GTT AAA GCG AAT ATC 
Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn He 
570 575 580 



TTT ACT TAT GGC GCT GGC ACG GAC TTT TTA TGG AAT ATC TTT AGA AGG 
he Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
585 590 595 



GTT TTT AGC GAT CAG TCC TTG AAT GTG GGG GTG TTT GGG GGC ATT CAA 
Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 
600 605 610 

ATA GCG GGT AAC ACT TGG GAT AGC TCT TTA AGA GGT CAA ATT GAA AAC 
He Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin He Glu Asn 
615 620 625 630 

TCG TTT AAA GAA TAC CCC ACT CCC ACG AAT TTC CAA TTT TTG TTT AAT 
Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
635 640 645 

TTG GGT TTA AGG GCT CAT TTT GCC AGC ACC ATG CAC CGC CGG TTT TTG 
Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
650 655 660 

AGC GCG TCT CAA AGC ATT CAG CAT GGG ATG GAA TTT GGC GTG AAA ATC 
Ser Ala Ser Gin Ser He Gin His Gly Met Glu Phe Gly Val Lys He 
665 670 675 

CG GCT ATC AAT CAA AGG TAT TTG AGG GCC AAT GGG GCT GAT GTG GAT 
ro Ala He Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
680 685 690 

TAC AGG CGT TTG TAT GCG TTC TAT ATC AAT TAC ACG ATA GGT TTT TAA 
Tyr Arg Arg Leu Tyr Ala Phe Tyr He Asn Tyr Thr He Gly Phe * 
695 700 705 710 



(2) ANGABEN ZU SEQ ID NO: 82: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 432 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 82: 



127 




Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
15 10 15 

lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
20 25 30 

Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
35 40 45 

Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
50 55 60 

Leu Gly lie Gly Asn Gin lie Val Asn Thr Asn Thr Thr Val Ser Asn 
65 70 75 80 

Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys lie Leu Pro Gin lie Glu 

85 90 95 

Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
100 105 110 

al Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
115 120 125 

Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly lie lie Lys Val 
130 135 140 

Leu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
145 150 155 160 

Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
165 170 175 

Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
180 185 190 

Ser Ala Lys Leu Gly Gin lie Ala Glu Asn Leu Lys Asn Gly Gly Ala 
195 200 205 

Gly Ser Met Leu Gin Lys Asp Val Lys Thr lie Ser Asp Arg lie Ala 
210 215 220 

Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
^25 230 235 240 

sp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
245 250 255 

Gly Val lie Asn Gly Phe Gly lie Gin Val Gly Tyr Lys Gin Phe Phe 
260 265 270 

Gly Asn Lys Arg Asn lie Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
275 280 285 

Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn lie 
290 295 300 

Phe Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn lie Phe Arg Arg 
305 310 315 320 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly lie Gin 
325 330 335 
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lie Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin lie Glu Asn 
340 345 350 

Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
355 360 365 

Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
370 375 380 

Ser Ala Ser Gin Ser lie Gin His Gly Met Glu Phe Gly Val Lys lie 
385 390 395 400 

Pro Ala lie Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
405 410 415 

Tyr Arg Arg Leu Tyr Ala Phe Tyr He Asn Tyr Thr He Gly Phe * 
420 425 430 



(2) ANGABEN ZU SEQ ID NO: 83: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1197 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS056 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1197 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 83: 

ATG GAA TCA GTA AAA ACA GGA AAA ACA AAT AAG GTT GGC AAG AAT ACA 
Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
435 440 445 

,G ATG GCT AAT ACA AAG GCA AAT AAA GAG ACT CAT TTT AAA CAA GTG 
|lu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
450 455 460 



AGC GCC ATT ACA AAT ATA ATC AGA TCA GTT GGT GGG TTT TTT ACA AAA 
Ser Ala He Thr Asn He He Arg Ser Val Gly Gly Phe Phe Thr Lys 
465 470 475 480 

ATT GCA AAG AGA GTT AGA GGA CTT GTA AAA AAA CAC CCC AAG AAA AGC 
He Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
485 490 495 

AGT GCG GCA TTA GTA GTA TTG ACC CAT ATT GCG TGC AAG AAA GCG AAA 
Ser Ala Ala Leu Val Val Leu Thr His He Ala Cys Lys Lys Ala Lys 
500 505 510 

GAA TTA GAC GAT AAA GTC CAA GAT AAA TCC AAA CAA GCT GAA AAA GAA 
Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
515 520 525 
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AAT CAA ATC AAT TGG TGG AAA TAT TCA GGA TTA ACA ATA GCG GCA AGT 
Asn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr lie Ala Ala Ser 
530 535 540 

TTA TTA TTA GCC GCT TGT AGC GCT GGT GAT ACT GAT AAA CAG ATA GAA 
Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin lie Glu 
545 550 555 560 

CTA GAA CAA GAA AAA AAG GAA GCT GAA AAC GCT AGG GAT AGA GCG AAC 
Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
565 570 575 

AAG AGT GGG ATA GAA CTA GAA CAA GAA AGA CAG AAA ACA AAC AAG AGT 
Lys Ser Gly lie Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
580 585 590 

GGG ATA GAA CTC GCT AAT AGT CAA ATA AAA GCA GAA CAA GAA AGA CAA 
Gly lie Glu Leu Ala Asn Ser Gin lie Lys Ala Glu Gin Glu Arg Gin 
595 600 605 
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AAG ACA GAA CAA GAA AAA CAA AAA GCA AAT AAG AGT GCG ATA GAG TTA 
iys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala lie Glu Leu 
610 615 620 




GAA CAG CAA AAA CAA AAG ACC ATT AAT ACA CAA AGA GAT TTG ATT AAA 
Glu Gin Gin Lys Gin Lys Thr lie Asn Thr Gin Arg Asp Leu lie Lys 
625 630 635 640 

GAA CAG AAA GAT TTC ATT AAA GAA ACA GAA CAA AAT TGC CAA GAA AAT 
Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
645 650 655 

CAT AAT CAA TTC TTT ATT AAA AAA TTA GGA ATT AAG GGT GGC ATT GCT 
His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly lie Ala 
660 665 670 

ATA GAA GTA GAA GCT GAA TGC AAA ACC CCT AAA CCT GCA AAA ACC AAT 
lie Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
675 680 685 

CAA ACC CCT ATC CAG CCA AAA CAC CTC CCA AAC TCT AAA CAA CCT CAT 
Gin Thr Pro lie Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
690 695 700 

|CT CAA AGA GGA TCA AAA GCG CAA GAG TTT ATC GCT TAT TTG CAA AAA 
er Gin Arg Gly Ser Lys Ala Gin Glu Phe lie Ala Tyr Leu Gin Lys 
705 710 * 715 720 

GAG CTA GAA TTT CTG CCC TAT TCG CAA AAA GCT ATC GCT AAA CAA GTG 
Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala lie Ala Lys Gin Val 
725 730 735 

AAT TTC TAT AAA CCA AGT TCT ATC GCT TAT TTA GAA CTA GAT CCT AGA 
Asn Phe Tyr Lys Pro Ser Ser lie Ala Tyr Leu Glu Leu Asp Pro Arg 
740 745 750 

GAT TTT AAG GTT ACA GAA GAA TGG CAA AAA GAA AAT CTA AAA ATA CGC 
Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys lie Arg 
755 760 765 



TCT AAA GCT CAA GCT AAA ATG CTT GAA ATG AGG GAT TTA AAA CCA GAC 
Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 



130 



770 775 780 

CCA CAA GCC CAC CTT CCA ACC TCT CAA AGC CTT TTG TTC GTT CAA AAA 1104 
Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
785 790 795 800 

ATA TTT GCT GAT GTT AAT AAA GAA ATA GAA GCA GTT GCT AAT ACT GAA 1152 
lie Phe Ala Asp Val Asn Lys Glu lie Glu Ala Val Ala Asn Thr Glu 
805 810 815 

AAG AAA GCA GAA AAA GCG GGT TAT GGT TAT AGT AAA AGG ATG TAG 1197 
Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
820 825 830 

(2) ANGABEN ZU SEQ ID NO: 84: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 399 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 84: 

Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
15 10 15 

Glu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
20 25 30 

Ser Ala lie Thr Asn lie lie Arg Ser Val Gly Gly Phe Phe Thr Lys 
35 40 45 

lie Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
50 55 60 

Ser Ala Ala Leu Val Val Leu Thr His lie Ala Cys Lys Lys Ala Lys 
65 70 75 80 



Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
85 90 95 



sn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr He Ala Ala Ser 
100 105 110 



Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin He Glu 

115 ' 120 125 

Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 

130 135 140 

Lys Ser Gly He Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 

145 150 155 160 

Gly He Glu Leu Ala Asn Ser Gin He Lys Ala Glu Gin Glu Arg Gin 

165 170 175 

Lys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala He Glu Leu 

180 185 190 

Glu Gin Gin Lys Gin Lys Thr He Asn Thr Gin Arg Asp Leu He Lys 
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195 200 205 

Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
210 215 220 

His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly He Ala 
225 230 235 240 

He Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
245 250 255 

Gin Thr Pro He Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
260 265 270 

Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe He Ala Tyr Leu Gin Lys 
275 280 285 

Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala He Ala Lys Gin Val 
290 295 300 



Asn Phe Tyr Lys Pro Ser Ser He Ala Tyr Leu Glu Leu Asp Pro Arg 
* 05 310 315 320 



Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys He Arg 
325 330 335 

Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
340 345 350 

Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
355 360 365 

He Phe Ala Asp Val Asn Lys Glu He Glu Ala Val Ala Asn Thr Glu 
370 375 380 

Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 85: 



• 



( i ) SEQUENZ KENNZE I CHEN : 

(A) LANGE: 1131 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS059 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .1131 



<xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 85: 

ATG AAT TTT TTT AAA ATC CTT TTA ATG GAA TTA AGA GCC ATT GTT TCT 4 8 

Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
400 405 410 415 
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CAT AAA GGC GTT TTA TTA ATC CTT ATA GGC GCT CCT TTA ATC TAT GGC 96 
His Lys Gly Val Leu Leu lie Leu lie Gly Ala Pro Leu lie Tyr Gly 
420 425 430 

TTA TTA TAC CCT TTG CCT TAT TTA AGA GAC ATC GTA ACG CAG CAA AAA 144 
Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp lie Val Thr Gin Gin Lys 
435 440 445 

ATC GCC CTT GTA GAT GAA GAC AAT TCC TTC CTT TCT AGG CAA TTA GCC 192 
lie Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
450 455 460 

TTC ATG GCG CAA AGC TCC AAC GAG TTA GAA ATC GCT TTT TTT AGC CCC 24 0 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu lie Ala Phe Phe Ser Pro 
465 470 475 

TCT ATG CTG GAA GCC AAA AAG CTT TTA AAA GAA GAA AAA ATT TAT GGG 288 
Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys lie Tyr Gly 
480 485 490 495 



• 



ATC TTG CAC ATT CCC TCT CAT TTT GAA GCC AAT ATC CAT AAA CAA GTG 336 
le Leu His lie Pro Ser His Phe Glu Ala Asn lie His Lys Gin Val 
500 505 510 



CCT GTA ACG ATA GAT TTT TAT GCG AAT TCC AAT TAC TTT TTG ATT TAT 384 
Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 
515 520 525 

GGT GCG TTA GCG AAT GCG GTG GTG GAG AGC ATC AAC GCT TTA AAT GAT 43 2 

Gly Ala Leu Ala Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp 
530 535 540 

GAG ATA AGG TTC AAA CGC AAT GCC CAA ATA GAA GAA GCT GAA TTA GGG 480 
Glu He Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 
545 550 555 

ACA GAC GGG ATT AAA ATC AGG CCT ATC GCT TTA TAT AAC CCT AGT GAG 52 8 

Thr Asp Gly lie Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 
560 565 570 575 



GGG TAT TTG AAT TAC GCG CTC TCT AGC GTG TTT ATT TTC ATT TTG CAC 576 
Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 
580 585 590 



AG GTG ATG CTC ATT GCA AGC AGC ATG TTT ACT AGC TCC AGG CGT TTG 624 
In Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
595 600 605 



GAA TTA GCC CTT TTA GAC AGA AAG CAA ATC GCT TTA AGG CTG TGC ACA 672 
Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
610 615 620 

AGA CTT TTG GTG TTC ATG GGG GCG TTT AGC GTT TTT ATT TTA TGG TAT 72 0 

Arg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
625 630 635 

TTT GGG GCG CTG TTT TCT TTT TAT GGG ATC GAA CGG CAT GGG AGC GCT 768 
Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
640 645 650 655 

TTA ATG GTG TTT TTG AAT AGT TTG ATT TTC ATG CTT GCA ACC TTG AGT 816 
Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
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660 665 670 

TTG GGG TCG TTT TTA GGC GCA TGG ATT AAA AAT GAA GCC CAC ACC ACT 
Leu Gly Ser Phe Leu Gly Ala Trp lie Lys Asn Glu Ala His Thr Thr 
675 680 685 

CAA ATC GTT TTA ATT TCT TCT TTG CCC TTG ATT TTT ATG ATG GGT TTT 
Gin lie Val Leu lie Ser Ser Leu Pro Leu lie Phe Met Met Gly Phe 
690 695 700 

GTG TGG CCT TTT GAA TCC TTG CCC TCT TAT TTA CAG GTT TTT GTT CAA 
Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
705 710 715 

ATA GTG CCA GCT TAT CAT GGG ATC AGT TTG CTA GGG CGA TTG AAT CAA 
lie Val Pro Ala Tyr His Gly lie Ser Leu Leu Gly Arg Leu Asn Gin 
720 725 730 735 

ATG CAT GCG GAA TTT ATA GAT GTT TCC TTC CAT TTT TAT GCG CTT ATT 
Met His Ala Glu Phe lie Asp Val Ser Phe His Phe Tyr Ala Leu lie 
740 745 750 

! CG ATT TTT ATT GCG AGT TTT ATA GGG AGT GTC TTT AAA CTC AGC TCT 
la lie Phe lie Ala Ser Phe lie Gly Ser Val Phe Lys Leu Ser Ser 
755 760 765 

TTA AAG AAA GCT TGT GAA AAC GCT TAA 
Leu Lys Lys Ala Cys Glu Asn Ala * 
770 775 



(2) ANGABEN ZU SEQ ID NO: 86: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 377 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 86: 

Met Asn Phe Phe Lys lie Leu Leu Met Glu Leu Arg Ala lie Val Ser 
1 5 10 15 

His Lys Gly Val Leu Leu lie Leu lie Gly Ala Pro Leu lie Tyr Gly 
20 25 30 

Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp lie Val Thr Gin Gin Lys 
35 40 45 

lie Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
50 55 60 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu lie Ala Phe Phe Ser Pro 
65 70 75 80 

Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys lie Tyr Gly 
85 90 95 



lie Leu His lie Pro Ser His Phe Glu Ala Asn lie His Lys Gin Val 
100 105 110 



134 



Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 

115 120 125 

Gly Ala Leu Ala Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp 

130 135 140 

Glu lie Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 

145 150 155 160 

Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 

165 170 175 

Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 

180 185 190 

Gin Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 

195 200 205 



Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
210 215 220 



g Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
'25 230 235 240 




Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
245 250 255 

Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
260 265 270 

Leu Gly Ser Phe Leu Gly Ala Trp He Lys Asn Glu Ala His Thr Thr 
275 280 285 

Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
290 295 300 

Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
305 310 315 320 

He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
325 330 335 

Met His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
340 345 350 

Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
355 360 365 

Leu Lys Lys Ala Cys Glu Asn Ala * 
370 375 

(2) ANGABEN ZU SEQ ID NO: 87: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 516 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
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(B) CLON(E) : HPS063 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..516 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 87: 

ATG TTT GTA GTT AAA ATG GTG TTA GGG TTT TTG ATC CTT TTA AGC CCT 
Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
380 385 390 

TTG TGC GCT ACT GGA TTG GAT ATT TCA CAA ACA GAT ATT ATA GAG CGT 
Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp He He Glu Arg 
395 400 405 

TCT TTA AAT TTC CTT TTA TTT GTG GGG ATT TTG TGG TAT TTT TCG GCT 
Ser Leu Asn Phe Leu Leu Phe Val Gly He Leu Trp Tyr Phe Ser Ala 
410 415 420 425 



AAA CTG CGT TCA TTT TTA CGC TCC AAA AGT CTT GAA ATC TCC AAA 
s Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu He Ser Lys 
430 435 440 



CGC TTA GAA GAG ATT CAA GCC CAA CTC AAA GTG AGT AAA GAA AAT AAG 
Arg Leu Glu Glu He Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
445 450 455 

AAA AAA CTC TTA AAA GAA TTA GAG CAA GCC AAA GAA AAA GCG GAA TTG 
Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
460 465 470 

ATT GTT TCT GAT GCG AAT AAA GAA GCT TAC ATG ATC ACG CAA AAA TAC 
He Val Ser Asp Ala Asn Lys Glu Ala Tyr Met He Thr Gin Lys Tyr 
475 480 485 

GAA TTG CAA ACC AAA ATG GAT GTG GAA AAT TTG ATC AAA AAT TCT AAG 
Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu He Lys Asn Ser Lys 
490 495 500 505 

GCG TTG ATG GAT TTA GAA GTT AAA AAG ATC AAA AGA GAG CTG GTT GAA 
Ala Leu Met Asp Leu Glu Val Lys Lys He Lys Arg Glu Leu Val Glu 
510 515 520 

AGC GTT TTT AAA GAT CTA AGA GAG AGC AAA AAA GTC TCT TTC AAT GCG 
Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
525 530 535 

CAA GAT TGC GTG AAT ATT TTG AAA CAA AGG CTT TAA 
Gin Asp Cys Val Asn He Leu Lys Gin Arg Leu * 
540 545 



(2) ANGABEN ZU SEQ ID NO: 88: 

( i ) S E QUEN Z KENN Z E I CHEN : 

(A) LANGE: 172 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 88: 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
15 10 15 

Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp lie lie Glu Arg 
20 25 30 

Ser Leu Asn Phe Leu Leu Phe Val Gly lie Leu Trp Tyr Phe Ser Ala 
35 40 45 

Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu lie Ser Lys 
50 55 60 

Arg Leu Glu Glu lie Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
65 70 75 80 

Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
85 90 95 

lie Val Ser Asp Ala Asn Lys Glu Ala Tyr Met lie Thr Gin Lys Tyr 
100 105 110 

'Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu lie Lys Asn Ser Lys 
115 120 125 

Ala Leu Met Asp Leu Glu Val Lys Lys lie Lys Arg Glu Leu Val Glu 
130 135 140 

Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
145 150 155 160 

Gin Asp Cys Val Asn lie Leu Lys Gin Arg Leu * 
165 170 

(2) ANGABEN ZU SEQ ID NO: 89: 

(i) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS069 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 89: 

ATG TCA AAT AGC ATG TTG GAT AAA AAT AAA GCG ATT CTT ACA GGG GGT 4 8 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala lie Leu Thr Gly Gly 
175 180 185 

GGG GCT TTA TTG TTA GGG CTA ATC GTG CTT TTT TAT TTG GCT TAT CGC 96 
Gly Ala Leu Leu Leu Gly Leu lie Val Leu Phe Tyr Leu Ala Tyr Arg 
190 195 200 



CCT AAG GCT GAA GTG TTG CAA GGA TTT TTG GAA GCC AGA GAA TAC AGC 
Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
205 210 215 220 

GTG AGT TCC AAA GTC CCT GGC CGC ATT GAA AAG GTG TTT GTT AAA AAA 
Val Ser Ser Lys Val Pro Gly Arg lie Glu Lys Val Phe Val Lys Lys 
225 230 235 

GGC GAT CGC ATT AAA AAG GGC GAT TTG GTT TTT AGC ATT TCT AGC CCT 
Gly Asp Arg He Lys Lys Gly Asp Leu Val Phe Ser He Ser Ser Pro 
240 245 250 

GAA TTA GAA GCC AAG CTC GCT CAA GCT GAA GCC GGG CAT AAA GCC GCT 
Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
255 260 265 

AAA GCG CTT AGC GAT GAA GTC AAA AGA GGC TCA AGA GAC GAA ACG ATC 
Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr lie 
270 275 280 



w* 1 



T TCT GGA AGA GAC GTT TGG CAA GCG GCC AAA TCT CAA GCC ACT TTA 
,sn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
'85 290 295 300 



GCC AAA GAG ACT TAT AAG CGC GTT CAA GAT TTG TAT GAT AAT GGC GTG 
Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
305 310 315 

GCG AGC TTG CAA AAG CGC GAT GAA GCC TAT GCG GCT TAT GAA AGC ACT 
Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
320 325 330 

AAA TAC AAC GAG AGC GCG GCT TAC CAA AAG TAT AAA ATG GCT TTA GGG 
Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
335 340 345 

GGG GCG AGC TCT GAA AGT AAG ATT GCC GCT AAG GCT AAA GAG AGC GCG 
Gly Ala Ser Ser Glu Ser Lys He Ala Ala Lys Ala Lys Glu Ser Ala 
350 355 360 

GCT TTA GGG CAA GTG AAT GAA GTG GAG TCT TAT TTA AAA GAT GTC AAA 
Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
365 370 375 380 



CG ACA GCC CCA ATT GAT GGG GAA GTG AGT AAT GTG CTT TTA AGC GGT 
la Thr Ala Pro He Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
385 390 395 



GGC GAG CTT AGC CCT AAG GGC TTT CCT GTG GTG CTC ATG ATT GAT TTA 
Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met He Asp Leu 
400 405 410 

AAG GAT AGT TGG TTA AAA ATC AGC GTG CCT GAA AAG TAT TTG AAC GAT 
Lys Asp Ser Trp Leu Lys He Ser Val Pro Glu Lys Tyr Leu Asn Asp 
415 420 425 

TTT AAA GTG GGT AAG GAA TTT GAA GGT TAT ATC CCG GCG TTG AAA AGA 
Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr He Pro Ala Leu Lys Arg 
430 435 440 



AGC GCG AAA TTC AGG GTC AAA TAT TTG AGC GTG ATG GGG GAT TTT GCG 
Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
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445 450 455 460 

ACT TGG AAA GCG ACG AAT AAT TCC AAC ACT TAC GAC ATG AAA AGC TAT 
Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
465 470 475 

GAA GTG GAG GCC ATA CCC TTA GAA GAG TTG GAA AAT TTT AGG GTA GGG 
Glu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
480 485 490 

ATG AGC GTG TTA GTT ACC ATT AAA CCT TAA 
Met Ser Val Leu Val Thr He Lys Pro * 
495 500 



(2) ANGABEN ZU SEQ ID NO: 90: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 330 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 90: 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala He Leu Thr Gly Gly 
15 10 15 

Gly Ala Leu Leu Leu Gly Leu He Val Leu Phe Tyr Leu Ala Tyr Arg 
20 25 30 

Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
35 40 45 

Val Ser Ser Lys Val Pro Gly Arg He Glu Lys Val Phe Val Lys Lys 
50 55 60 

Gly Asp Arg He Lys Lys Gly Asp Leu Val Phe Ser He Ser Ser Pro 
65 70 75 80 

Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
85 90 95 

Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr He 
100 105 110 

Asn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
115 " 120 125 

Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
130 135 140 

Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
145 150 155 160 

Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
165 170 175 

Gly Ala Ser Ser Glu Ser Lys He Ala Ala Lys Ala Lys Glu Ser Ala 
180 185 190 

Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
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195 200 205 

Ala Thr Ala Pro lie Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
210 215 220 

Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met He Asp Leu 
225 230 235 240 

Lys Asp Ser Trp Leu Lys He Ser Val Pro Glu Lys Tyr Leu Asn Asp 
245 250 255 

Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr He Pro Ala Leu Lys Arg 
260 265 270 

Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
275 280 285 

Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
290 295 300 

glu Val Glu Ala He Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
( 05 310 315 320 

et Ser Val Leu Val Thr He Lys Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 91: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 684 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS091 

(ix) MERKMAL: 

(A) NAME / S CHL US S E L : CDS 

(B) LAGE:1..684 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 91: 

ATG GTA TTT GAC AGA ACA ATC AGC GTA AGA GAA AAA AAA GCG GCT AAA 
Met Val Phe Asp Arg Thr He Ser Val Arg Glu Lys Lys Ala Ala Lys 
335 340 345 

ACG CTT GGG ATT ATT GGG ATC GTC TTT TTT ATT TTG TTT GGC ATC GTG 
Thr Leu Gly He He Gly He Val Phe Phe He Leu Phe Gly He Val 
350 355 360 

ATA AGC GGG GTG GCT TTT CAA AAA GAG TGG GTG CAA CAA TTG GAT TTA 
He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
365 370 375 

TTT TTT ATA GAC TTG ATC CGC AAC CCT GCC CCC ATT CAA AAA AGC GCG 
Phe Phe He Asp Leu He Arg Asn Pro Ala Pro He Gin Lys Ser Ala 
380 385 390 
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TGG CTT TCT TTC GTG TTT TTT AGC ACT TGG TTT GCA CAA AGC AAG CTC 
Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
395 400 405 410 

ACC ACT CCT ATA GCC TTA CTC ATT GGC TTG TGG TTT GGG TTT CAA AAA 
Thr Thr Pro lie Ala Leu Leu lie Gly Leu Trp Phe Gly Phe Gin Lys 
415 420 425 

CGC ATC GCT TTG GGG GTG TGG TTT TTC TTT AGC ATC TTA TTA GGT GAA 
Arg lie Ala Leu Gly Val Trp Phe Phe Phe Ser lie Leu Leu Gly Glu 
430 435 440 

TTC ACC TTA AAA TCC CTT AAG CTT TTA GTG GCG CGC CCA CGG CCT GTA 
Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
445 450 455 

ACC AAT GGC GAA TTG GTT TTC GCG CAT GGC TTT AGT TTC CCT AGC GGG 
Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
460 465 470 



p 



T GCT TTG GCT TCA GCG CTT TTT TAC GGC TCT TTG GCG TTG TTG TTA 
is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
75 480 485 490 




TGC TAT TCT AAC GCC AAC AAT CGC ATT AAA ACG ATT ATT GCT GTG GTT 
Cys Tyr Ser Asn Ala Asn Asn Arg lie Lys Thr lie lie Ala Val Val 
495 500 505 

TTG CTT TTT TGG ATT TTT TTA ATG GCG TAT GAT AGG GTT TAT TTA GGG 
Leu Leu Phe Trp lie Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
510 515 520 

GTG CAT TAC CCT AGC GAT GTT TTA GGA GGG TTT TTA TTA GGG ATT GCT 
Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly lie Ala 
525 530 535 

TGG TCG TGC TGC TCT TTA GCG CTT TAT TTA GGG TTT TTG AAA CGC CCT 
Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
540 545 550 

TAT AAT CAA TAA 
Tyr Asn Gin * 
555 

(2) ANGABEN ZU SEQ ID NO: 92: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 228 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 92: 

Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
15 10 15 

Thr Leu Gly He He Gly He Val Phe Phe He Leu Phe Gly He Val 
20 25 30 



He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
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35 40 45 

Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro lie Gin Lys Ser Ala 
50 55 60 

Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
65 70 75 80 

Thr Thr Pro lie Ala Leu Leu lie Gly Leu Trp Phe Gly Phe Gin Lys 

85 90 95 

Arg lie Ala Leu Gly Val Trp Phe Phe Phe Ser lie Leu Leu Gly Glu 
100 105 110 

Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
115 120 125 

Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
130 135 140 

is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
|45 150 155 160 

r Cys Tyr Ser Asn Ala Asn Asn Arg lie Lys Thr lie lie Ala Val Val 
165 170 175 

Leu Leu Phe Trp He Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
180 185 190 

Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly He Ala 
195 200 205 

Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
210 215 220 

Tyr Asn Gin * 
225 

(2) ANGABEN ZU SEQ ID NO: 93: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 72 9 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS095 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..729 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 93: 

ATG AAA AAA ATT TTT TCT CAA TCT TTG TTA GCT TTG GTT GTT TCT GTC 
Met Lys Lys He Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
230 235 240 
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(i) S E QUENZ KENNZ E I CHEN : 

(A) LANGE : 243 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 94: 

Met Lys Lys lie Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
15 10 15 

Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
20 25 30 

Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp He Asn Ser Gin Lys 
35 40 45 

Gin Ala Thr Ser Ala Thr He Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
50 55 60 

In Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
5 70 75 80 

^sp Tyr Ala His Ala Asn Ser He Arg Leu Lys Asn Pro Asn Tyr Asn 

85 90 95 

Asn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu He 
100 105 110 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
115 120 125 

Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val He Asn Asn 
130 135 140 

Gly He Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
145 150 155 160 

Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 
165 170 175 



Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
180 185 190 



ly Ala Arg Leu Arg He Leu Lys His Ser Ser He Glu Ala Gly Val 
195 200 205 

Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr He Thr Ala Lys Asn Leu 
210 215 220 

Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
225 230 235 240 

Thr Phe * 

(2) ANGABEN ZU SEQ ID NO: 95: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 975 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
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(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS099 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..975 



i 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 95: 

ATG CCG GAA AAT TCT AAA CTA CAA CCT GCT AAG TTA GGG AAA AAT TTT 

Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
245 250 255 

GAC CCT GTG GAT CAT TCT AAC AGG AAT TTT TTC TTT TCT CTC ATT CTG 

Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu lie Leu 

60 265 270 275 



T GTA TTG TTA CAC TGG TTG ATT TAT TTT TTA TTT GAA CAC AGA GAA 
er Val Leu Leu His Trp Leu lie Tyr Phe Leu Phe Glu His Arg Glu 
280 285 290 

GAT TTT TTT CCT TCA AAA CCC AAG CTT GTT AAA TTA AAT CCT GAA AAT 
Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
295 300 305 

TTA TTG GTT TTA AAA AGA GGC CAT TCG CAA GAT CCC AGT AAA AAC ACC 
Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
310 315 320 

CAG GGC GCT CCT AAA CCC ACG CTG GCT GGC CCC CAA AAA CCT CCA ACG 
Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
325 330 335 

CCT CCC ACA CCC CCA ACT CCG CCA ACC CCG CCA ACC CCG CCA AAA CCT 
Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
340 345 350 355 

ATA GAA AAG CCT AAG CCT GAG CCT AAA CCA AAA CCC AAA CCT GAA CCC 
klle Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
I 360 365 370 

AAA AAG CCC AAT CAT AAA CAC AAG GCT CTT AAA AAA GTG GAA AAA GTG 
Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
375 380 385 

GAA GAG AAA AAA GTA GTA GAG GAG AAA AAA GAA GAG AAA AAA ATC GTA 
Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys lie Val 
390 395 400 

GAG CAG AAA GTA GAA CAA AAA GTA GAG CAG AAA AAA ATA GAA GAG AAA 
Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys lie Glu Glu Lys 
405 410 415 

AAA CCT GTC AAA AAA GAA TTT GAC CCT AAC CAG CTT TCT TTC TTG CCT 
Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
420 425 430 435 
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AAA GAA GTT GCG CCA CCC AGA CAA GAA AAT AAT AAA GGC TTG GAT AAC 624 
Lys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
440 445 450 

CAA ACC AGA AGG GAT ATT GAT GAA TTG TAT GGC GAA GAA TTT GGG GAT 672 
Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
455 460 465 

TTA GGC ACA GCC GAA AAA GAT TTC ATC AGG AAT AAT TTA AGG GAT ATT 720 
Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp lie 
470 475 480 

GGG CGC ATC ACG CAA AAA TAT TTA GAA TAC CCT CAA GTA GCG GCT TAT 768 
Gly Arg lie Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
485 490 495 

TTA GGG CAG GAC GGG ACG AAT GCG GTA GAG TTT TAC TTG CAC CCT AAT 816 
Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
500 505 510 515 

£GC GAT ATT ACC GAT CTT AAA ATC ATC ATT GGC TCT GAA TAC AAA ATG 864 
ly Asp lie Thr Asp Leu Lys lie lie lie Gly Ser Glu Tyr Lys Met 
520 525 530 

CTT GAT GAC AAC ACC TTA AAG ACC ATT CAG ATC GCT TAT AAG GAT TAC 912 
Leu Asp Asp Asn Thr Leu Lys Thr lie Gin lie Ala Tyr Lys Asp Tyr 
535 540 545 

CCA CGC CCC AAA ACT AAA ACC CTC ATT CGC ATC AGA GTG CGT TAT TAC 960 
Pro Arg Pro Lys Thr Lys Thr Leu lie Arg lie Arg Val Arg Tyr Tyr 
550 555 560 

TTA GGG GGC AAT TAA 975 
Leu Gly Gly Asn * 
565 



(2) ANGABEN ZU SEQ ID NO: 96: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 325 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 96: 

Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
15 10 15 

Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu lie Leu 
20 25 30 

Ser Val Leu Leu His Trp Leu lie Tyr Phe Leu Phe Glu His Arg Glu 
35 40 45 

Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
50 55 60 



Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
65 70 75 80 
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Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 

85 90 95 

Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
100 105 110 

lie Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
115 120 125 

Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
130 135 140 

Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys lie Val 
145 150 155 160 

Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys lie Glu Glu Lys 
165 170 175 



Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
180 185 190 



s Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
195 200 205 



Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
210 215 220 

Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp lie 
225 230 235 240 

Gly Arg lie Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
245 250 255 

Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
260 265 270 

Gly Asp lie Thr Asp Leu Lys lie lie lie Gly Ser Glu Tyr Lys Met 
275 280 285 

Leu Asp Asp Asn Thr Leu Lys Thr lie Gin lie Ala Tyr Lys Asp Tyr 
290 295 300 

Pro Arg Pro Lys Thr Lys Thr Leu lie Arg lie Arg Val Arg Tyr Tyr 
305 310 315 320 

Leu Gly Gly Asn * 
325 

(2) ANGABEN ZU SEQ ID NO: 97: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1290 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS117 (HPS118, HPS162) 



(ix) MERKMAL: 
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(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .12 90 



^P&h 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 97: 

ATG CCA TAC GCC TTA AGA AAA AGA TTT TTC AAA CGC TTT GCG CTG ATT 
Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu lie 
330 335 340 

GTT TCA ACT TTT TGT GCG ATA AGC TTG AAC GCT AAA AGC TAT CTG TTT 
Val Ser Thr Phe Cys Ala lie Ser Leu Asn Ala Lys Ser Tyr Leu Phe 
345 350 355 

TCC CCT TTG CCC CCA GCA CAC CAG CAA ATC ATT AAG ACA GAG CCT TGC 
Ser Pro Leu Pro Pro Ala His Gin Gin lie lie Lys Thr Glu Pro Cys 
360 365 370 

TCT TTG GAA TGC TTG AAA GAC TTG ATG CTG CAA AAT CAA ATC TTT TCT 
Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin lie Phe Ser 
375 380 385 




T GTG TCT CAA TAC GAT AAC AAC AAC CAA GAT GAG AGC CTT AAA ACT 
he Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 
390 395 400 405 

TAT TAT CAT GAC ATA CTC AAT AAA CTC AAC CCC GTA TTC ATC GCT TCT 
Tyr Tyr His Asp lie Leu Asn Lys Leu Asn Pro Val Phe lie Ala Ser 
410 415 420 

CAA ACT CCA GCT AAA GAA AGC TAT GAG CCT AAG ATT GAA TTA GCG GTT 
Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys lie Glu Leu Ala Val 
425 430 435 

TTA CTG CCT AAA AAG GTG GTG GGG CGT TAT GCG ATT TCG GTG ATG AAC 
Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala lie Ser Val Met Asn 
440 445 450 

ACC CTT TTA GCG TAT TTG AAC ACC AGA AAC AAC GAT TTC AAT ATC CAA 
Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn lie Gin 
455 460 465 

GTC TTT GAC AGC GAT GAA GAA AGC CCT GAA AAA TTA GAG CAA ACC TAT 
Val Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
|470 475 480 485 

AAA GAA ATT GAA AAA GAA AAA TTC CCT TTT GTG ATA GCC TTA TTG ACT 
Lys Glu lie Glu Lys Glu Lys Phe Pro Phe Val lie Ala Leu Leu Thr 
490 495 500 

AAA GAG GGC GTG GAA AAT TTG CTC CAA AAC ACC ACC ATT AGC ACC CCT 
Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr lie Ser Thr Pro 
505 510 515 

ACT TAT GTG CCT ACG GTG AAT AGA GCG CAA TTG GAA AAT CAA ACT GAA 
Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
520 525 530 

CGT TCT TTG AGC GAG CGC TTG TAT TTT GGG GGG ATT GAT TAT AAA GAG 
Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly lie Asp Tyr Lys Glu 
535 540 545 
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CAA TTA AGC ATG CTC ACG GCT TTC ATT AAC CCT AAT TCG CCC GTG ATT 720 
Gin Leu Ser Met Leu Thr Ala Phe lie Asn Pro Asn Ser Pro Val lie 
550 555 560 565 

GAA TAC GAT GAC GAT GGC CTA ATA GGT GAA CGC TTG AGG CAA ATC ACG 768 
Glu Tyr Asp Asp Asp Gly Leu lie Gly Glu Arg Leu Arg Gin lie Thr 
570 575 580 

GAG TCT TTA AGC ATT GAA GTC AAA CAC CAA GAA AAT ATT TCT TAC AAG 816 
Glu Ser Leu Ser lie Glu Val Lys His Gin Glu Asn lie Ser Tyr Lys 
585 590 595 

CAA GCC ACG AGT TTT TCT AAA AAT TTT AGA AAA AAC GAT GCG TTT TTT 864 
Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
600 605 610 

AAA AAT TCT ATT TTG ATT TTA AAC ACC CCT ACC ACT AAA AGC GGC CTT 912 
Lys Asn Ser lie Leu lie Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
615 620 625 



# 



TT CTT TCT CAA ATA GGG CTT TTA GAA TAC AAG CCT CTT AAA ATC CTT 960 
e Leu Ser Gin lie Gly Leu Leu Glu Tyr Lys Pro Leu Lys lie Leu 
0 635 640 645 



TCC ACA CAA ATC AAT TTC AAC CCC TCT CTA CTC TTA CTC ACC CAA CCT 1008 
Ser Thr Gin lie Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
650 655 660 

AAA GAC AGA AAG GAT TTA TTC ATT GTC AAT GCC TTG CAA AAT AGC GAT 1056 
Lys Asp Arg Lys Asp Leu Phe lie Val Asn Ala Leu Gin Asn Ser Asp 
665 670 675 

GAA ACG CTT ATA GAA TAC GCC TCC TTA TTG GAG AGC GAT TTA AGG CAT 1104 
Glu Thr Leu lie Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
680 685 690 

GAT TGG GTG AAT TAT TCC AGC GCA ATC GGG CTA GAG GTG TTT TTA AAC 1152 
Asp Trp Val Asn Tyr Ser Ser Ala lie Gly Leu Glu Val Phe Leu Asn 
695 700 705 

ACG CTA GAT CCG CAT TTT AAA AAA TCT TTT CAA GAG AAT TTA GAA GAC 1200 
Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
710 715 720 725 

AAT CAG GTC CGT TAC CAC AAT CAA ATT TAT CAG GCT TTA GGG TAT TCT 1248 
Asn Gin Val Arg Tyr His Asn Gin lie Tyr Gin Ala Leu Gly Tyr Ser 
730 735 740 

TTT GAG CCA ATA AAA AAT GAA AGC GGA ACA AAA AAA GAA TAA 12 90 

Phe Glu Pro lie Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
745 750 755 



(2) ANGABEN ZU SEQ ID NO: 98: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 430 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 98: 
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Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu lie 

15 10 15 

Val Ser Thr Phe Cys Ala lie Ser Leu Asn Ala Lys Ser Tyr Leu Phe 

20 25 30 

Ser Pro Leu Pro Pro Ala His Gin Gin lie lie Lys Thr Glu Pro Cys 

35 40 45 

Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin lie Phe Ser 

50 55 60 

Phe Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 

65 70 75 80 

Tyr Tyr His Asp lie Leu Asn Lys Leu Asn Pro Val Phe lie Ala Ser 

85 90 95 



Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys lie Glu Leu Ala Val 
100 105 110 



# 



u Leu Pro Lys Lys Val Val Gly Arg Tyr Ala lie Ser Val Met Asn 
115 120 125 



Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn lie Gin 

130 135 140 

Val Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 

145 150 155 160 

Lys Glu lie Glu Lys Glu Lys Phe Pro Phe Val lie Ala Leu Leu Thr 

165 170 175 

Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr lie Ser Thr Pro 

180 185 190 

Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 

195 200 205 

Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly lie Asp Tyr Lys Glu 

210 215 220 



Gin Leu Ser Met Leu Thr Ala Phe lie Asn Pro Asn Ser Pro Val lie 
225 230 235 240 



lu Tyr Asp Asp Asp Gly Leu lie Gly Glu Arg Leu Arg Gin lie Thr 
245 250 255 

Glu Ser Leu Ser lie Glu Val Lys His Gin Glu Asn He Ser Tyr Lys 
260 265 270 

Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
275 280 285 

Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
290 295 300 

He Leu Ser Gin He Gly Leu Leu Glu Tyr Lys Pro Leu Lys He Leu 

305 310 315 320 

Ser Thr Gin He Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
325 330 335 
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Lys Asp Arg Lys Asp Leu Phe lie Val Asn Ala Leu Gin Asn Ser Asp 
340 345 350 

Glu Thr Leu lie Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
355 360 365 

Asp Trp Val Asn Tyr Ser Ser Ala lie Gly Leu Glu Val Phe Leu Asn 
370 375 380 

Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
385 390 395 400 

Asn Gin Val Arg Tyr His Asn Gin lie Tyr Gin Ala Leu Gly Tyr Ser 
405 410 415 

Phe Glu Pro lie Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
420 425 430 

(2) ANGABEN ZU SEQ ID NO: 99: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1644 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT : 

(B) CLON(E) : HPS004 (HPS027, HPS121, HPS131) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1644 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 99: 



ATG 
Met 


GAT 
Asp 


AAA 
Lys 


AAC 
Asn 


AAC 
Asn 
435 


AAT 
Asn 


AAT 
Asn 


CTC 
Leu 


CGC 
Arg 


TTG 
Leu 
440 


ATT 
He 


TTA 
Leu 


GCG 
Ala 


ATC 
He 


GCT 
Ala 
445 


CTG 
Leu 


48 


TCT 

.Ser 


TTC 
Phe 


TTG 
Leu 


TTT 
Phe 
450 


ATC 
He 


GCT 
Ala 


CTT 
Leu 


TAT 
Tyr 


AGC 
Ser 
455 


TAT 
Tyr 


TTT 
Phe 


TTC 
Phe 


CAA 
Gin 


AAA 
Lys 
460 


CCA 
Pro 


AAC 
Asn 


96 


AAA 
Lys 


ACA 
Thr 


ACA 
Thr 
465 


ACC 
Thr 


CAA 
Gin 


ACC 
Thr 


ACA 
Thr 


AAG 
Lys 
470 


CAA 
Gin 


GAA 
Glu 


ACA 
Thr 


ACC 
Thr 


AAC 
Asn 
475 


AAC 
Asn 


CAT 
His 


ACA 
Thr 


144 


GCA 
Ala 


ACA 
Thr 
480 


AGT 
Ser 


CCT 
Pro 


AAC 
Asn 


GCG 
Ala 


CCC 
Pro 
485 


AAC 
Asn 


GCC 
Ala 


CAA 
Gin 


CAT 
His 


TTT 
Phe 
490 


AGC 
Ser 


ACC 
Thr 


ACT 
Thr 


CAA 
Gin 


192 


ACA 
Thr 
495 


ACC 
Thr 


CCC 
Pro 


CAA 
Gin 


GAG 
Glu 


AAT 
Asn 
500 


TTG 
Leu 


CTA 
Leu 


AGC 
Ser 


ACG 
Thr 


ATT 
He 
505 


TCT 
Ser 


TTT 
Phe 


GAG 
Glu 


CAT 
His 


GCC 
Ala 
510 


240 


AGG 
Arg 


ATT 
He 


GAA 
Glu 


ATT 
He 


GAT 
Asp 
515 


TCT 
Ser 


TTA 
Leu 


GGG 
Gly 


CGC 
Arg 


ATC 
He 
520 


AAA 
Lys 


CAG 
Gin 


GTT 
Val 


TAT 
Tyr 


CTC 
Leu 
525 


AAG 
Lys 


288 



GAT AAA AAG TAT CTA ACC CCT AAA CAA AAG GGC TTT TTA GAG CAT GTG 
Asp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
530 535 540 

GGC CAT CTT TTT AGC TCC AAA GAA AAC GCG CAA CCC CCC CTA AAA GAG 
Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
545 550 555 

CTC CCC CTT TTA GCA GCC GAT AAA CTC AAG CCT TTA GAA GTG CGT TTT 
Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
560 565 570 

TTA GAC CCT ACG CTC AAT AAC AAA GCG TTC AAC ACC CCT TAT AGC GCT 
Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
575 580 585 590 

TCA AAA ACC ACT CTT GGG CCT AAC GAA CAG CTT GTT TTA ACC CAA GAT 
Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
595 600 605 



TA GGC ACT CTT AGC ATC ATT AAA ACC CTG ACT TTC TAT GAT GAT TTG 
u Gly Thr Leu Ser lie lie Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
610 615 620 



ys 



CAT TAT GAT TTA AAA ATC GCA TTC AAA TCG CCC AAT AAC CTT ATC CCT 
His Tyr Asp Leu Lys He Ala Phe Lys Ser Pro Asn Asn Leu He Pro 
625 630 635 

AGC TAT GTG ATC ACC AAT GGT TAC AGG CCG GTG GCT GAT TTG GAC AGC 
Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
640 645 650 

TAC ACC TTT TCA GGC GTG CTT TTA GAA AAT AGC GAC AAA AAA ATT GAA 
Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
655 660 665 670 

AAA ATT GAA GAT AAA GAC GCT AAA GAA ATC AAA CGC TTT TCT AAC ACC 
Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
675 680 685 

CTC TTT TTA TCC AGC GTG GAT AGG TAT TTC ACC ACC TTG CTT TTC ACT 
Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr. 
690 695 700 



GAT CCT CAA GGT TTT GAA GCC TTA ATT GAT TCA GAA ATC GGC ACT 
ys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
705 710 715 

AAA AAC CCC TTA GGG TTC ATT TCC CTT AAA AAT GAA GCG AAT TTG CAT 
Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
720 725 730 

GGC TAT ATT GGC CCT AAG GAT TAC CGC TCT TTG AAA GCG ATT TCA CCC 
Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
735 740 745 750 

ATG CTC ACC GAT GTG ATA GAG TAT GGC TTA ATC ACT TTC TTT GCA AAA 
Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
755 760 765 



GGC GTG TTT GTT TTA CTG GAT TAT TTG TAT CAA TTC GTG GGC AAT TGG 
Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
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770 775 780 

GGT TGG GCT ATC ATT CTT TTA ACG ATT ATC GTG CGC ATC ATC CTT TAT 
Gly Trp Ala lie lie Leu Leu Thr lie lie Val Arg lie lie Leu Tyr 
785 790 795 

CCT TTA AGC TAT AAG GGC ATG GTG AGC ATG CAA AAG CTC AAA GAA TTA 
Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
800 805 810 

GCC CCT AAA ATG AAA GAA CTC CAA GAA AAA TAC AAG GGC GAA CCC CAA 
Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
815 820 825 830 

AAA TTG CAA GCC CAC ATG ATG CAG CTT TAC AAA AAA CAT GGG GCT AAC 
Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
835 840 845 

CCA CTA GGG GGT TGT CTG CCC TTA ATC TTA CAA ATC CCG GTG TTT TTT 
Pro Leu Gly Gly Cys Leu Pro Leu lie Leu Gin lie Pro Val Phe Phe 
850 855 860 

CC ATT TAT AGA GTG CTT TAT AAC GCT GTG GAA TTG AAA AGC TCA GAG 
la lie Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
865 870 875 

TGG ATC TTA TGG ATT CAT GAT TTA TCC ATC ATG GAT CCG TAT TTT ATT 
Trp lie Leu Trp lie His Asp Leu Ser lie Met Asp Pro Tyr Phe lie 
880 885 890 

TTA CCG CTT CTT ATG GGA GCG TCT ATG TAT TGG CAC CAA AGC GTT ACG 
Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
895 900 905 910 

CCA AAC ACC ATG ACC GAT CCC ATG CAA GGA AAG ATT TTT AAA CTC TTA 
Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys lie Phe Lys Leu Leu 
915 920 925 

CCC CTA TTA TTC ACA ATC TTT TTA ATC ACT TTC CCG GCA GGG TTA GTC 
Pro Leu Leu Phe Thr lie Phe Leu lie Thr Phe Pro Ala Gly Leu Val 
930 935 940 

TTG TAT TGG ACC ACG AAC AAC ATC CTT TCG GTG TTG CAA CAA CTC ATC 
Leu Tyr Trp Thr Thr Asn Asn lie Leu Ser Val Leu Gin Gin Leu lie 
945 950 955 

ATC AAT AAA GTC TTA GAG AAT AAA AAA CGC ATG CAT GCG CAA AAC AAA 
lie Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
960 965 970 

AAG GAA CAT TGA 
Lys Glu His * 
975 



(2) ANGABEN ZU SEQ ID NO: 100: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 548 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 100: 

Met Asp Lys Asn Asn Asn Asn Leu Arg Leu lie Leu Ala lie Ala Leu 
15 10 15 

Ser Phe Leu Phe lie Ala Leu Tyr Ser Tyr Phe Phe Gin Lys Pro Asn 
20 25 30 

Lys Thr Thr Thr Gin Thr Thr Lys Gin Glu Thr Thr Asn Asn His Thr 
35 40 45 

Ala Thr Ser Pro Asn Ala Pro Asn Ala Gin His Phe Ser Thr Thr Gin 
50 55 60 

Thr Thr Pro Gin Glu Asn Leu Leu Ser Thr lie Ser Phe Glu His Ala 
65 70 75 80 

Arg lie Glu lie Asp Ser Leu Gly Arg lie Lys Gin Val Tyr Leu Lys 
85 90 95 

sp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
100 105 110 

Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
115 120 125 

Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
130 135 140 

Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
145 150 155 160 

Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
165 170 175 

Leu Gly Thr Leu Ser lie lie Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
180 185 190 

His Tyr Asp Leu Lys lie Ala Phe Lys Ser Pro Asn Asn Leu lie Pro 
195 200 205 

Ser Tyr Val lie Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
210 215 220 

r Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
225 230 _ 235 240 

Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
245 250 255 

Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
260 265 270 

Lys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
275 280. 285 

Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
290 295 300 

Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
305 310 315 320 
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Met Leu Thr Asp Val lie Glu Tyr Gly Leu lie Thr Phe Phe Ala Lys 
325 330 335 

Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
340 345 350 

Gly Trp Ala lie lie Leu Leu Thr lie lie Val Arg lie lie Leu Tyr 
355 360 365 

Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
370 375 380 

Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
385 390 395 400 

Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
405 410 415 



Pro Leu Gly Gly Cys Leu Pro Leu lie Leu Gin lie Pro Val Phe Phe 
420 425 430 



a lie Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
435 440 445 




Trp lie Leu Trp lie His Asp Leu Ser lie Met Asp Pro Tyr Phe lie 
450 455 460 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
465 470 475 480 

Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys lie Phe Lys Leu Leu 
485 490 495 

Pro Leu Leu Phe Thr lie Phe Leu lie Thr Phe Pro Ala Gly Leu Val 
500 505 510 

Leu Tyr Trp Thr Thr Asn Asn lie Leu Ser Val Leu Gin Gin Leu He 
515 520 525 

He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
530 535 540 

Lys Glu His * 
545 

(2) ANGABEN ZU SEQ ID NO: 101: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 3063 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS132 



(ix) 



MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..3063 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 101: 



ATG ATG CTC GCT TCC ATT ATT GAA TTT TCC TTA CGC CAA AGA GTG ATC 
Met Met Leu Ala Ser He He Glu Phe Ser Leu Arg Gin Arg Val He 
550 555 560 

GTG ATT GTT GGT GCG ATT CTT ATT TTA TTT TTT GGG ACT TAT AGT TTT 
Val He Val Gly Ala He Leu He Leu Phe Phe Gly Thr Tyr Ser Phe 
565 570 575 580 

ATC AAC ACT CCA GTG GAC GCT TTC CCG GAT ATT TCG CCC ACT CAA GTT 
He Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
585 590 595 

AAA ATC ATT TTA AAA CTC CCC GGC TCT AGC CCT GAA GAA ATG GAA AAC 
Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
600 605 610 

AAC ATC GTG CGC CCT TTA GAA TTG GAG CTT TTA GGC TTG AAA GGG CAA 
Asn He Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
615 620 625 




TCT TTA AGG AGT GTT TCA AAA TAT TCT ATT TCA GAT ATT ACG ATA 
,ys Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 
630 635 640 

GAT TTT GAT GAC AGC GTG GAT ATT TAT TTA GCG AGG AAT ATT GTC AAT 
Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 
645 650 655 660 

GAG CGC TTG AGC AGC GTG ATG AAA GAT TTA CCC GTG GGG GTT GAG GGG 
Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
665 670 675 

GGC ATG GCG CCC ATT GTT ACG CCG CTA TCA GAT ATC TTT ATG TTC ACT 
Gly Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
680 685 690 

ATT GAT GGC AAT ATC ACT GAG ATA GAA AAA CGA CAG CTT TTA GAT TTT 
He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
695 700 705 

GTG ATC CGC CCA CAA TTA AGA ATG ATT AGC GGC GTA GCA GAT GTC AAT 
k Val He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
710 715 720 

TCC ATT GGA GGC TTT AGC AGA GCG TTT GTG ATC GTG CCG GAT TTT AAT 
Ser lie Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
725 730 735 740 

GAC ATG GCA AGG CTT GGG GTG AGT ATT TCT GAT TTA GAA TCG GCT GTG 
Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
745 750 755 

AGA GTG AAT TTA AGA AAC AGC GGA GCG GGG CGC GTG GAT AGA GAT GGC 
Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
760 765 770 

GAA ACC TTT TTA GTC AAA ATC CAA ACC GCT TCT TTG AGT TTA GAA GAC 
Glu Thr Phe Leu Val Lys He Gin Thr Ala Ser Leu Ser Leu Glu Asp 
775 780 785 
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ATT GGC AAA ATC ACC GTT TCC ACT AAT TTA GGG CAT TTG CAC ATT AAG 
lie Gly Lys lie Thr Val Ser Thr Asn Leu Gly His Leu His lie Lys 
790 795 800 

GAT TTT GCG AAA GTC ATC AGC CAG TCT CGC ACC CGT TTG GGG TTT GTT 
Asp Phe Ala Lys Val lie Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
805 810 815 820 

ACT AAA GAT GGC GTG GGC GAG ACC ACA GAA GGC TTG GTG CTT TCT TTA 
Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
825 830 835 

AAA GAC GCT AAC ACC AAA GAA ATC ATC ACT CAA GTG TAT CAA AAA CTA 
Lys Asp Ala Asn Thr Lys Glu lie lie Thr Gin Val Tyr Gin Lys Leu 
840 845 850 

GAA GAA TTA AAA CCC TTT TTA CCG AAT GGC GTG TCC ATT AAT GTT TTT 
Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser lie Asn Val Phe 
855 860 865 



0 



'AT GAT CGC TCA GAA TTT ACG CAA AAA GCC ATT GCC ACC GTT TCT AAA 
r Asp Arg Ser Glu Phe Thr Gin Lys Ala lie Ala Thr Val Ser Lys 
870 875 880 



i 

s; 



ACC CTC ATT GAA GCC GTT GTT TTA ATC ATC ATC ACG CTC TTT TTA TTT 
Thr Leu lie Glu Ala Val Val Leu lie lie lie Thr Leu Phe Leu Phe 
885 890 895 900 

TTA GGG AAT TTG AGG GCG AGC GTG GCT GTG GGG GTG ATT TTA CCT TTA 
Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val lie Leu Pro Leu 
905 910 915 

AGC TTG TCC GTG GCG TTT ATT TTT ATC AAG TTT AGC GAT CTG ACT TTA 
Ser Leu Ser Val Ala Phe lie Phe lie Lys Phe Ser Asp Leu Thr Leu 
920 925 930 

AAT TTG ATG AGT TTA GGG GGA TTG GTT ATC GCT ATA GGC ATG CTC ATT 
Asn Leu Met Ser Leu Gly Gly Leu Val lie Ala lie Gly Met Leu lie 
935 940 945 

GAC TCA GCC GTG GTG GTG GTG GAA AAC GCT TTT GAA AAA TTA AGC GCT 
Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
950 955 960 



C ACT AAA ACC ACT AAA CTC CAT GCA ATC TAT CGT TCG TGT AAA GAA 
sn Thr Lys Thr Thr Lys Leu His Ala lie Tyr Arg Ser Cys Lys Glu 
965 970 975 980 

ATC GCT GTT TCA GTG GTG AGC GGG GTG GTG ATC ATC ATT GTG TTT TTT 
lie Ala Val Ser Val Val Ser Gly Val Val lie lie lie Val Phe Phe 
985 990 995 

GTG CCG ATT TTA ACC TTA CAG GGG TTA GAG GGT AAG ATG TTT AGG CCT 
Val Pro lie Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
1000 1005 1010 

TTA GCG CAA AGC ATT GTG TAT GCG CTT TTA GGC ACT TTA GTT CTA TCT 
Leu Ala Gin Ser lie Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
1015 1020 1025 



ATT ACA ATC ATT CCT GTA GTC AGC TCT CTT GTC TTA AAA GCC ACG CCC 
lie Thr lie lie Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 



1030 



1035 



1040 



CAT AGC GAA ACC TTT TTA ACG AGG TTT TTA AAC AGA ATC TAC GCC CCT 
His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg lie Tyr Ala Pro 
1045 1050 1055 1060 

TTA TTG GAA TTT TTT GTG CAT AAC CCT AAA AAA GTG ATT TTA GGA GCG 
Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val lie Leu Gly Ala 
1065 1070 1075 

TTT GTT TTT TTA ATC GCA AGC CTT TCT TTA TTC CCT TTT GTG GGG AAG 
Phe Val Phe Leu lie Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
1080 1085 1090 

AAT TTC ATG CCC GTT TTA GAT GAG GGC GAT GTG GTT TTG AGC GTG GAA 
Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
1095 1100 1105 

ACC ACC CCT TCT ATT TCT TTA GAT CAA TCT AGG GAT CTC ATG CTA AAC 
Thr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
1110 1115 1120 



'T GAG AGC GCG ATT AAA AAG CAT GTC AAG GAA GTT AAA AGC ATT GTC 
le Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
1125 1130 1135 1140 

GCG CGC ACA GGG AGC GAT GAA TTG GGG CTG GAT TTA GGA GGT TTG AAT 
Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
1145 1150 1155 

CAA ACC GAT ACT TTT ATT TCT TTT ATT CCT AAA AAA GAA TGG AGC GTT 
Gin Thr Asp Thr Phe lie Ser Phe lie Pro Lys Lys Glu Trp Ser Val 
1160 1165 1170 

AAA ACC AAA GAT GAA TTA TTA GAA AAA ATC ATG GAT TCT TTA AAA GAC 
Lys Thr Lys Asp Glu Leu Leu Glu Lys lie Met Asp Ser Leu Lys Asp 
1175 1180 1185 

TTT AAG GGG ATT AAC TTT TCT TTC ACC CAA CCC ATT GAA ATG AGA ATT 
Phe Lys Gly lie Asn Phe Ser Phe Thr Gin Pro lie Glu Met Arg lie 
1190 1195 1200 



m 

^^^^ n 



TCT GAA ATG CTG ACA GGG GTT AGG GGG GAT TTA GCG GTT AAG ATT TTT 
Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys lie Phe 
' 205 1210 1215 1220 



GGA GAT GGT ATT AGC GAA TTG AAT GAA TTG AGT TTT CAA ATC GCG CAA 
Gly Asp Gly lie Ser Glu Leu Asn Glu Leu Ser Phe Gin lie Ala Gin 
1225 1230 1235 

GCT CTA AAA GGG ATT AAA GGA TCT AGT GAA GTT TTA ACC ACG CTT AAT 
Ala Leu Lys Gly lie Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
1240 1245 1250 

GAG GGC GTG AAT TAT TTG TAT GTA ACC CCT AAT AAA GAA TCG ATG GCG 
Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
1255 1260 1265 

GAT GTG GGG ATC ACT AGC GAT GAA TTT TCC AAG TTT TTA AAA TCC GCT 
Asp Val Gly lie Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
1270 1275 1280 
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TTA GAG GGC TTG GTT GTA GAT GTG ATC CCT ACA GGG ATT TCA CGC ACG 
Leu Glu Gly Leu Val Val Asp Val lie Pro Thr Gly lie Ser Arg Thr 
1285 1290 1295 1300 

CCA GTG ATG ATC CGC CAA GAG AGC GAT TTT GCA AGC TCT ATC ACT AAA 
Pro Val Met lie Arg Gin Glu Ser Asp Phe Ala Ser Ser lie Thr Lys 
1305 1310 1315 

ATC AAA AGT TTA GCC TTG ACT TCA AAA TAT GGC GTT TTA GTG CCT ATC 
lie Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro lie 
1320 1325 1330 

ACT TCT ATC GCC AAA ATT GAA GAA GTG GAT GGC CCT GTT TCT GTT GTG 
Thr Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
1335 1340 1345 

CGT GAA AAT TCA ATG CGC ATG AGC GTG GTT CGC AGT AAT GTG GTG GGG 
Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
1350 1355 1360 



CG< 

P 



CGC GAT TTG AAA TCT TTT GTA GAA GAG GCT AAA AAA GTG ATC GCT CAA 
g Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
365 1370 1375 1380 



Ser 



AAC ATC AAA CTC CCT CCC AGC TAC TAT ATC ACT TAT GGG GGG CAG TTT 
Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
1385 1390 1395 

GAA AAC CAG CAA CGG GCC AAT AAA AGG CTC TCC ACC GTT ATC CCT TTA 
Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
1400 1405 1410 

AGC ATC TTA GCG ATT TTT TTC ATT CTT TTT TTC ACT TTT AAA AGC ATT 
Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
1415 1420 1425 

CCT TTA GCC TTG CTC ATT CTT TTG AAT ATC CCT TTT GCG GTT ACC GGA 
Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
1430 1435 1440 

GGC CTT ATT GCG TTG TTT GCG GTC GGG GAG TAT ATT TCA GTG CCA GCG 
Gly Leu He Ala Leu Phe Ala Val Gly Glu Tyr He Ser Val Pro Ala 
1445 1450 1455 1460 



GTG GGC TTT ATC GCT CTT TTT GGG ATT GCG GTT TTA AAT GGC GTG 
Ser Val Gly Phe He Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
1465 1470 1475 

GTG ATG ATA GGC TAT TTT AAA GAG CTT CTC TTG CAA GGG AAA AGC GTA 
Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
1480 1485 1490 

GAA GAA TGC GTT TTA TTG GGC GCT AAA AGG CGT TTG AGA CCG GTT TTA 
Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
1495 1500 1505 

ATG ACC GCT TGC ATT GCC GGT TTG GGT TTG CTC CCT TTA TTA TTT TCT 
Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
1510 1515 1520 



CAT AGC GTG GGA TCA GAA GTC CAA AAA CCT TTA GCG ATC GTG GTG CTT 
His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala He Val Val Leu 
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1525 1530 1535 1540 

GGA GGC TTG GTT ACC TCA AGC GCT CTA ACC TTA CTC CTA CTG CCG CCA 3 024 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
1545 1550 1555 

ATG TTT ATG CTC ATC GCT AAA AAG ATT AAA ATC GTT TGA 3 063 

Met Phe Met Leu lie Ala Lys Lys He Lys He Val * 

1560 1565 



(2) ANGABEN ZU SEQ ID NO: 102: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1021 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 102: 

et Met Leu Ala Ser He He Glu Phe Ser Leu Arg Gin Arg Val He 
15 10 15 



Val He Val Gly Ala He Leu He Leu Phe Phe Gly Thr Tyr Ser Phe 

20 25 30 

He Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
35 40 45 

Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
50 55 60 

Asn He Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 

65 70 75 80 

Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 

85 90 95 

Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 

100 105 110 



Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
115 120 125 

'Gly Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
130 135 140 

He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
145 150 155 160 

Val He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
165 170 175 

Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
180 185 190 

Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
195 200 205 

Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
210 215 220 
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Glu Thr Phe Leu 
225 

lie Gly Lys lie 



Asp Phe Ala Lys 
260 

Thr Lys Asp Gly 
275 

Lys Asp Ala Asn 
290 

Glu Glu Leu Lys 
305 

Tyr Asp Arg Ser 



hr Leu lie Glu 
340 

Leu Gly Asn Leu 
355 

Ser Leu Ser Val 
370 

Asn Leu Met Ser 
385 

Asp Ser Ala Val 



Asn Thr Lys Thr 
420 

lie Ala Val Ser 
435 

Val Pro lie Leu 
450 

Leu Ala Gin Ser 
465 

lie Thr lie lie 



His Ser Glu Thr 
500 

Leu Leu Glu Phe 
515 

Phe Val Phe Leu 
530 

Asn Phe Met Pro 
545 



Val Lys 
230 

Thr Val 
245 

Val He 

Val Gly 

Thr Lys 

Pro Phe 
310 

Glu Phe 
325 

Ala Val 

Arg Ala 

Ala Phe 

Leu Gly 
390 

Val Val 
405 

Thr Lys 

Val Val 

Thr Leu 

He Val 
470 

Pro Val 
485 

Phe Leu 

Phe Val 

lie Ala 

Val Leu 
550 



He Gin 



Ser Thr 



Ser Gin 



Glu Thr 
280 

Glu He 
295 

Leu Pro 

Thr Gin 

Val Leu 

Ser Val 
360 

He Phe 
375 

Gly Leu 

Val Glu 

Leu His 

Ser Gly 
440 

Gin Gly 
455 

Tyr Ala 

Val Ser 

Thr Arg 

His Asn 
520 

Ser Leu 
535 

Asp Glu 



Thr Ala 

Asn Leu 
250 

Ser Arg 
265 

Thr Glu 

He Thr 

Asn Gly 

Lys Ala 
330 

He He 
345 

Ala Val 

He Lys 

Val He 

Asn Ala 
410 

Ala He 
425 

Val Val 

Leu Glu 

Leu Leu 

Ser Leu 
490 

Phe Leu 
505 

Pro Lys 
Ser Leu 
Gly Asp 



Ser Leu 
235 

Gly His 
Thr Arg 
Gly Leu 



Gin Val 
300 

Val Ser 
315 

He Ala 



He Thr 



Gly Val 

Phe Ser 
380 

Ala He 
395 

Phe Glu 

Tyr Arg 

He He 

Gly Lys 
460 

Gly Thr 
475 

Val Leu 
Asn Arg 



Lys Val 



Phe Pro 
540 

Val Val 
555 



Ser Leu 



Leu His 



Leu Gly 
270 

Val Leu 
285 

Tyr Gin 

He Asn 

Thr Val 

Leu Phe 
350 

He Leu 
365 

Asp Leu 

Gly Met 

Lys Leu 

Ser Cys 
430 

He Val 
445 

Met Phe 

Leu Val 

Lys Ala 

He Tyr 
510 

He Leu 
525 

Phe Val 
Leu Ser 



Glu Asp 
240 

He Lys 
255 

Phe Val 

Ser Leu 

Lys Leu 

Val Phe 
320 

Ser Lys 
335 

Leu Phe 



Pro Leu 



Thr Leu 



Leu He 
400 

Ser Ala 
415 

Lys Glu 



Phe Phe 



Arg Pro 

Leu Ser 
480 

Thr Pro 
495 

Ala Pro 

Gly Ala 

Gly Lys 

Val Glu 
560 
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Thr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
565 570 575 

lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
580 585 590 

Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
595 600 605 

Gin Thr Asp Thr Phe lie Ser Phe lie Pro Lys Lys Glu Trp Ser Val 
610 615 620 

Lys Thr Lys Asp Glu Leu Leu Glu Lys lie Met Asp Ser Leu Lys Asp 
625 630 635 640 

Phe Lys Gly lie Asn Phe Ser Phe Thr Gin Pro lie Glu Met Arg lie 
645 650 655 



Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys lie Phe 
660 665 670 



ly Asp Gly lie Ser Glu Leu Asn Glu Leu Ser Phe Gin lie Ala Gin 
675 680 685 




Ala Leu Lys Gly lie Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
690 695 700 

Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
705 710 715 720 

Asp Val Gly lie Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
725 730 735 

Leu Glu Gly Leu Val Val Asp Val lie Pro Thr Gly lie Ser Arg Thr 
740 745 750 

Pro Val Met lie Arg Gin Glu Ser Asp Phe Ala Ser Ser lie Thr Lys 
755 760 765 

lie Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro lie 
770 775 780 

Thr Ser lie Ala Lys lie Glu Glu Val Asp Gly Pro Val Ser Val Val 
785 790 795 800 

Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
805 810 815 

Arg Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val lie Ala Gin 
820 825 830 

Asn lie Lys Leu Pro Pro Ser Tyr Tyr lie Thr Tyr Gly Gly Gin Phe 
835 840 845 

Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val lie Pro Leu 
850 855 860 

Ser lie Leu Ala lie Phe Phe lie Leu Phe Phe Thr Phe Lys Ser lie 
865 870 875 880 

Pro Leu Ala Leu Leu lie Leu Leu Asn lie Pro Phe Ala Val Thr Gly 
885 890 895 
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Gly Leu lie Ala Leu Phe Ala Val Gly Glu Tyr lie Ser Val Pro Ala 
900 905 910 

Ser Val Gly Phe lie Ala Leu Phe Gly lie Ala Val Leu Asn Gly Val 
915 920 925 

Val Met lie Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
930 935 940 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
945 950 955 960 

Met Thr Ala Cys lie Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
965 970 975 

His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala lie Val Val Leu 
980 985 990 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
995 1000 1005 

et Phe Met Leu lie Ala Lys Lys lie Lys lie Val * 
1010 1015 1020 

(2) ANGABEN ZU SEQ ID NO: 103: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 202 8 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS149 

(ix) MERKMAL: 

(A) NAME / S CHLUS S EL : CDS 

(B) LAGE:1..2028 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 103: 

TTG TCT AAA GGT TTG AGT ATC GGT AAT AAA ATC ATA TTG TGC GTG GCG 
Leu Ser Lys Gly Leu Ser lie Gly Asn Lys lie lie Leu Cys Val Ala 
1025 1030 1035 

TTG ATT GTG ATC GTG TGC GTG AGC ATT TTA GGG GTG TCC TTA AAC AGC 
Leu lie Val lie Val Cys Val Ser lie Leu Gly Val Ser Leu Asn Ser 
1040 1045 1050 

AGG GTG AAA GAG ATT TTA AAA GAA AGC GCT CTG CAT TCT ATG CAA GAT 
Arg Val Lys Glu lie Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
1055 1060 1065 

AGT TTG CAT TTT AAG GTT AAT GAA GTG CAA GGG GTT TTA GAA AAC ACT 
Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
1070 1075 1080 1085 



TAT ACG AGC ATG GGC ATT GTT AAA GAA ATG CTC CCT AAA GAC ACC AAA 
Tyr Thr Ser Met Gly lie Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
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1090 1095 1100 

AGA GAA ATC AAA ATC GGC TTG TTA AAA AAC TTC ATT TTA GCC AAT TCG 2 88 

Arg Glu lie Lys lie Gly Leu Leu Lys Asn Phe lie Leu Ala Asn Ser 
1105 1110 1115 

CAT GTC GCT GGG GTG AGC ATG TTT TTT AAA GGC AGA GAA GAT TTA AGA 336 
His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
1120 1125 1130 

TTA ACG CTT TTA AGG GAT AAC AAT ACG ATT AAG CTA GTG GAA AAT CCG 384 
Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 
1135 1140 1145 

TCA TTA GAG AAT AGC CCT TTA GCG CAA AAA GCG ATG AAA AAT AAA GAA 432 
Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
1150 1155 1160 1165 

ATT TCT AAA AGT TTG GGT TAT TAT AGG AAA ATG CCT AAT GGG GCG GAA 4 80 

lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
1170 1175 1180 

TT TAT GGG GTG GAT ATT CTT TTA CCT TTA TTG AAT GAG AAC GCT CAA 52 8 

al Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
1185 1190 1195 

GAG GTT GTA GGG GCT TTG ATG ATT TTT ATT TCC ATT GAC AGC TTC AGC 576 
Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 
1200 1205 1210 

AAT GAA ATC ACT AAA AAC AGG AGC GAT TTA TTT TTA ATT GGC ACT AAA 624 
Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
1215 1220 1225 

GGT AAA GTG CTT TTG AGC GCG AAT AAG AGT TTG CAA GAC AAA CCT ATC 672 
Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
1230 1235 1240 1245 

GCA GAA ATT TAT AAG AGC GTG CCT AAA GCC ACC AAC GAA GTG ATG GCT 720 
Ala Glu lie Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
1250 1255 1260 

ATT TTA GAA AAC GGC TCT AAA GCG ACT TTA GAA TAC TTA GAT CCC TTT 768 
t Ile Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
1265 " 1270 1275 

AGC CAT AAG GAA AAT TTT TTA GCC GTT GAA ACC TTT AAA ATG CTA GGC 816 
Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
1280 1285 1290 

864 



912 



AAA 


ACA 


GAA 


AGT 


AAA 


GAC 


AAT 


CTT 


AAT 


TGG 


ATG 


ATC 


GCT 


TTA 


ATC 


ATT 


Lys 


Thr 


Glu 


Ser 


Lys 


Asp 


Asn 


Leu 


Asn 


Trp 


Met 


He 


Ala 


Leu 


He 


He 




1295 








1300 








1305 








GAA 


AAA 


GAC 


AAG 


GTC 


TAT 


GAG 


CAA 


GTA 


GGC 


TCG 


GTG 


CGT 


TTT 


GTG 


GTG 


Glu 


Lys 


Asp 


Lys 


Val 


Tyr 


Glu 


Gin 


Val 


Gly 


Ser 


Val 


Arg 


Phe 


Val 


Val 


1310 








1315 








1320 








1325 


ATC 


ATA 


GCG 


AGC 


GCA 


ATC 


ATG 


GTG 


TTA 


GCC 


TTG 


ATT 


ATA 


GCG 


ATC 


ACT 


He 


He 


Ala 


Ser 


Ala 


He 


Met 


Val 


Leu 


Ala 


Leu 


He 


He 


Ala 


He 


Thr 










1330 








1335 








1340 



960 
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CTC TTA ATG CGA GCG ATC GTG AGC AGT CGT TTG GAA GCC GTT TCT AGC 1008 
Leu Leu Met Arg Ala lie Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
1345 1350 1355 

ACC TTG TCT CAT TTC TTT AAA TTA TTG AAC AAT CAA GCC AAT TCT AGC 1056 
Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
1360 1365 1370 

GGT ATT AAA TTG ATT GAA GCG AAA TCC AAT GAC GAG TTA GGC CGC ATG 1104 
Gly lie Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
1375 1380 1385 

CAA ACA GCG ATC AAT AAA AAT ATC TTG CAA ACC CAA AAA ATC ATG CAA 1152 
Gin Thr Ala He Asn Lys Asn He Leu Gin Thr Gin Lys He Met Gin 
1390 1395 1400 1405 

GAA GAC AGG CAA GCC GTC CAA GAC ACC ATT AAA GTG GTT TCA GAT GTG 1200 
Glu Asp Arg Gin Ala Val Gin Asp Thr He Lys Val Val Ser Asp Val 
1410 1415 1420 

GCA GGG AAT TTT GCG GTG CGC ATC ACG GCT GAG CCC GCA AGC CCT 124 8 

.ys Ala Gly Asn Phe Ala Val Arg He Thr Ala Glu Pro Ala Ser Pro 
1425 1430 1435 

GAT TTG AAA GAA TTG AGG GAC GCG CTA AAT GGG ATC ATG GAT TAT TTG 12 96 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly He Met Asp Tyr Leu 
1440 1445 1450 

CAA GAA AGC GTA GGG ACT CAC ATG CCA AGC ATT TTC AAA ATC TTT GAA 1344 
Gin Glu Ser Val Gly Thr His Met Pro Ser He Phe Lys He Phe Glu 
1455 1460 1465 

AGC TAT TCT GGT TTG GAT TTT AGA GGC CGG ATC CAA AAC GCT TCG GGT 13 92 

Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg He Gin Asn Ala Ser Gly 
1470 1475 1480 1485 

AGG GTG GAA CTG GTT ACT AAC GCT TTA GGG CAA GAA ATC CAA AAA ATG 1440 
Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu He Gin Lys Met 
1490 1495 1500 

CTA GAA ACT TCG TCT AAT TTT GCC AAA GAT TTA GCG AAC GAT AGC GCG 14 88 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
1505 1510 1515 

BaAT TTA AAA GAG TGC GTG CAA AAT TTA GAA AAA GCT TCA AAC TCC CAA 153 6 

^Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
1520 . 1525 1530 

CAC AAA AGC TTG ATG GAA ACT TCC AAA ACG ATA GAA AAT ATC ACC ACT 1584 
His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 
1535 1540 1545 

TCC ATT CAA GGC GTG AGC TCT CAA AGT GAA GCC ATG ATT GAA CAA GGG 1632 
Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
1550 1555 1560 1565 

CAA GAC ATT AAA AGC ATT GTA GAA ATC ATT AGA GAT ATT GCT GAT CAA 1680 
Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
1570 1575 1580 

ACC AAT CTT TTA GCC TTA AAC GCC GCT ATT GAA GCC GCA AGG GCC GGC 1728 
Thr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
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1585 1590 1595 

GAG CAT GGC AGA GGC TTT GCG GTG GTG GCT GAT GAG GTA AGA AAG CTC 1776 
Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
1600 1605 1610 

GCT GAA AGG ACG CAA AAA TCG CTC AGC GAG ATT GAA GCC AAT ATC AAT 1824 
Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu lie Glu Ala Asn lie Asn 
1615 1620 1625 

ATT TTA GTG CAA AGC ATT TCA GAC ACG AGC GAA AGC ATT AAA AAC CAG 1872 
lie Leu Val Gin Ser lie Ser Asp Thr Ser Glu Ser lie Lys Asn Gin 
1630 1635 1640 1645 

GTT AAA GAA GTG GAA GAA ATC AAC GCT TCT ATT GAA GCC TTA AGA TCG 192 0 

Val Lys Glu Val Glu Glu lie Asn Ala Ser lie Glu Ala Leu Arg Ser 
1650 1655 1660 



# 



GTT ACT GAG GGC AAT CTA AAA ATC GCT AGC GAT TCT TTA GAA ATC AGT 1968 
Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
1665 1670 1675 



AA GAA ATT GAC AAA GTT TCT AAC GAT ATT TTA GAA GAT GTG AAT AAA 2016 
£ln Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
1680 1685 1690 

AAG CAG TTT TAA 2028 
Lys Gin Phe * 
1695 



(2) ANGABEN ZU SEQ ID NO: 104: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 676 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 104: 

Leu Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
15 10 15 

Leu He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
20 25 30 

Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
35 40 45 

Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
50 55 60 

Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
65 70 75 80 

Arg Glu He Lys He Gly Leu Leu Lys Asn Phe He Leu Ala Asn Ser 
85 90 95 

His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
100 105 HO 
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Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 
115 120 125 

Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
130 135 140 

lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
145 150 155 160 

Val Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
165 170 175 

Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 
180 185 190 

Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
195 200 205 

Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
210 215 220 

la Glu lie Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
25 230 235 240 

lie Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
245 250 255 

Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
260 265 270 

Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met lie Ala Leu lie lie 
275 280 285 

Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
290 295 300 

lie lie Ala Ser Ala lie Met Val Leu Ala Leu lie lie Ala lie Thr 
305 310 315 320 

Leu Leu Met Arg Ala lie Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
325 330 335 

Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
340 345 350 

Gly lie Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
355 _ 360 365 

Gin Thr Ala lie Asn Lys Asn lie Leu Gin Thr Gin Lys lie Met Gin 
370 375 380 

Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
385 390 395 400 

Lys Ala Gly Asn Phe Ala Val Arg lie Thr Ala Glu Pro Ala Ser Pro 
405 410 415 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly lie Met Asp Tyr Leu 
420 425 430 

Gin Glu Ser Val Gly Thr His Met Pro Ser lie Phe Lys lie Phe Glu 
435 440 445 
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Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg lie Gin Asn Ala Ser Gly 
450 455 460 

Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu lie Gin Lys Met 
465 470 475 480 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
485 490 495 

Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
500 505 510 

His Lys Ser Leu Met Glu Thr Ser Lys Thr lie Glu Asn He Thr Thr 
515 520 525 

Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
530 535 540 

Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
545 550 555 560 

hr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
565 570 575 

Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
580 585 590 

Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
595 600 605 

He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
610 615 620 

Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
625 630 635 640 

Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
645 650 655 

Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
660 665 670 



Lys Gin Phe * 
675 



(2) ANGABEN ZU SEQ ID NO: 105: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 273 Basenpaare 

(B) ART : Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS161 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..273 



168 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 105: 

GTG GCG GTG AAA AAA ATC GTT GTG AGT TGG TGT GTG GCG TTG GCT TTT 
Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
680 685 690 

TTA AGC GCG GAT TCA GCA CAA GCC AAT AAA GCG ATC AGT AAT GCG GAT 
Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala lie Ser Asn Ala Asp 
695 700 705 

TTG ATT AAA GAG ATA AGG GAT TTA AAA AAA ATC ATC AGC GCG CAA AAC 
Leu lie Lys Glu lie Arg Asp Leu Lys Lys lie lie Ser Ala Gin Asn 
710 715 720 

ACT GAG ATT AAC AAC TTA AGA AAA GTG CAA GAA GTG TTG TCT GGG CAA 
Thr Glu lie Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
725 730 735 740 

TTA GGG GAC ATG CGT AAG GAT ATA TTA AGC ACT AGA GAT TAT TGC ATT 
Leu Gly Asp Met Arg Lys Asp lie Leu Ser Thr Arg Asp Tyr Cys lie 
745 750 755 

GC TTA AGG CCT TAT ATC TAT AAT TGG CGC TAG 
Ser Leu Arg Pro Tyr lie Tyr Asn Trp Arg * 
760 765 

(2) ANGABEN ZU SEQ ID NO: 106: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 91 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 106: 

Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
15 10 15 

Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala lie Ser Asn Ala Asp 
20 25 30 



eu lie Lys Glu lie Arg Asp Leu Lys Lys lie lie Ser Ala Gin Asn 
35 40 45 



Thr Glu lie Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
50 55 60 

Leu Gly Asp Met Arg Lys Asp lie Leu Ser Thr Arg Asp Tyr Cys lie 
65 70 75 80 

Ser Leu Arg Pro Tyr lie Tyr Asn Trp Arg * 
85 90 

(2) ANGABEN ZU SEQ ID NO: 107: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 759 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON(E) : HPS176 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .759 




Gin 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 107: 

ATG TTA GGG AAA AAA AAC GAA GAA GTC TTG ATT GAT GAA AAT TTG GTT 
Met Leu Gly Lys Lys Asn Glu Glu Val Leu lie Asp Glu Asn Leu Val 
95 100 105 

GGG GGT GTG ATA GCC CTT GAT AGA TTG GCA AAA CTC AAT AAG GCC AAT 
Gly Gly Val lie Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
110 115 120 

t AGG ACT TTC AAA AGG GCT TTT TAT CTC TCT ATG GCA CTC AAT GTC GCC 
g Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
125 130 135 

GCT GTA ACG AGT ATT GTG ATG ATG ATG CCT TTG AAG AAA ACG GAT ATA 
Ala Val Thr Ser lie Val Met Met Met Pro Leu Lys Lys Thr Asp lie 
140 145 150 155 

TTT GTT TAT GGC ATT GAT CGA TAC ACA GGA GAA TTT AAA ATT GTC AAA 
Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
160 165 170 

CGC TCC GAT GCT AGG CAA ATC GTC AAT TCT GAA GCC GTT GTG GAT AGT 
Arg Ser Asp Ala Arg Gin lie Val Asn Ser Glu Ala Val Val Asp Ser 
175 180 185 

GCA ACT TCA AAA TTT GTA TCA TTG CTG TTT GGT TAT AGC AAA AAT TCT 
Ala Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
190 195 200 

TTG AGG GAT CGC AAG GAT CAA CTA ATG CAG TAT TGC GAT GTG AGT TTC 
Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
205 210 215 



ACC CAA GCA ATG AGA ATG TTC AAT GAA AAT ATC AGA CAA TTC GTA 

Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 

220 225 _ 230 235 

GAT AAA GTC CGA GCA GAA GCT ATC ATT AGC TCT AAC ATA CAA AGA GAA 
Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 

240 245 250 

AAA GTC AAA AAT AGT CCC TTA ACG AGA TTA ACA TTT TTC ATT ACC ATC 

Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 

255 260 265 

AAA ATC ACA CCT GAT ACA ATG GAA AAT TAT GAA TAT ATC ACT AAA AAA 

Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 

270 275 280 



CAA GTA ACT ATT TAT TAT GAT TTT GCT AGA GGT AAC TCT TCT CAA GAA 
Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 



170 



285 290 

AAT CTT ATC ATC AAT CCT TTT GGC TTC 
Asn Leu lie lie Asn Pro Phe Gly Phe 
300 305 

ACA GAT TTA CAA AAC GAA CAG ACG GTA 
Thr Asp Leu Gin Asn Glu Gin Thr Val 
320 

AGA GAA GTG GAA TCA AAA AAT AAG GCA 
Arg Glu Val Glu Ser Lys Asn Lys Ala 
335 340 



295 

AAA GTG TTT GAC ATT CAA ATC 672 
Lys Val Phe Asp lie Gin lie 
310 315 

AGC GAA ATT TTG AGA AAG ATC 720 
Ser Glu lie Leu Arg Lys lie 
325 330 

TTA AAT AAA TAA 759 
Leu Asn Lys * 



(2) ANGABEN ZU SEQ ID NO: 108: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 253 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 108: 

Met Leu Gly Lys Lys Asn Glu Glu Val Leu He Asp Glu Asn Leu Val 
1 5 10 15 

Gly Gly Val He Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
20 25 30 

Arg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
35 40 45 

Ala Val Thr Ser He Val Met Met Met Pro Leu Lys Lys Thr Asp He 
50 55 60 

Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
65 70 75 80 



Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 

85 90 95 



la Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
100 105 HO 



Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
115 " 120 125 

Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
130 135 140 

Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
145 150 155 160 

Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
165 170 175 

Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
180 185 190 

Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 



195 



200 



205 



Asn Leu lie lie Asn 
210 

Thr Asp Leu Gin Asn 
225 

Arg Glu Val Glu Ser 
245 



Pro Phe Gly Phe Lys 
215 

Glu Gin Thr Val Ser 
230 

Lys Asn Lys Ala Leu 
250 



Val Phe Asp lie Gin lie 
220 

Glu lie Leu Arg Lys lie 
235 240 

Asn Lys * 



(2) ANGABEN ZU SEQ ID NO: 109: 

( i ) SEQUENZ KENNZE I CHEN : 

(A) LANGE: 1245 Basenpaare 

(B) ART: Nucleotid 

<C) STRANGFORM : be ides 
(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS187 

( ix) MERKMAL : 

(A) NAME / S CHLUS SE L : CDS 

(B) LAGE : 1 . .1245 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 10 9: 

ATG GAG AAA GGA GTT TGG AAT ATG CTT GAC ATA TGG ATA GAT ATG ATA 
Met Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp lie Asp Met lie 
255 260 265 

ATT TGT ATT TTT TAT TTG CTC TTT TTT ACG ACT CCT TAC ATT GTA GGC 
lie Cys lie Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr lie Val Gly 
270 275 280 285 

GAT ATT TTG CAA TTG AAA TTT ATC CGC CAA AAG CTC TGC GAA AAA CCT 
Asp lie Leu Gin Leu Lys Phe lie Arg Gin Lys Leu Cys Glu Lys Pro 
290 295 300 



t GTT TTA CTC CCA CAA AAG GAT TAT GAA GAA GCG GGA AAT TAT GCC ATT 
al Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala lie 
305 310 315 



AGG AAA ATG CAA TTA TCC ATT ATT TCT CAA ATT TTA GAC GGG ATA ATC 
Arg Lys Met Gin Leu Ser lie lie Ser Gin lie Leu Asp Gly lie lie 
320 325 330 

TTT GCT GGG TGG GTC TTT TTT GGT TTG ACG CAT TTA GAA GAT CTC ACG 
Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
335 340 345 

CAT TAT TTA AAC CTT CCT GAA ACG CTA GGT TAC TTG GTG TTT GCC TTG 
His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
350 355 360 365 

TTG TTT TTA GCG ATT CAA AGC GTT TTA GCT TTA CCC ATT AGC TAC TAC 
Leu Phe Leu Ala lie Gin Ser Val Leu Ala Leu Pro lie Ser Tyr Tyr 
370 375 380 
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ACC ACG ATG CAT TTG GAT AAG GAA TTT GGC TTT TCT AAG GTG AGC TTG 
Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
385 390 395 

TCG TTG TTT TTT AAG GAT TTT TTC AAA GGG TTA TCG CTC ACT TTA AGC 
Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
400 405 410 

GTG GGG TTG TTG TTG ATT TAC ACT CTC ATT ATG ATC ATT GAA CAT GTG 
Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met lie lie Glu His Val 
415 420 425 

GAA CAT TGG GAG ATT AGC TCG TTT TTT GTC GTG TTT GTT TTT ATG ATC 
Glu His Trp Glu lie Ser Ser Phe Phe Val Val Phe Val Phe Met lie 
430 435 440 445 

TTG GCT AAT CTT TTT TAC CCT AAA ATC GCT CAG CTT TTC AAC CAA TTC 
Leu Ala Asn Leu Phe Tyr Pro Lys lie Ala Gin Leu Phe Asn Gin Phe 
450 455 460 

ACC CCC TTG AAC AAT AGG GAT TTA GAG AGT CAA ATT GAG GGC ATG ATG 
hr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin lie Glu Gly Met Met 
465 470 475 

GAT AAG GTG GGT TTT AAA TCT GAA GGT ATC TTT GTG ATG GAC GCT AGC 
Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
480 485 490 

AAG AGG GAC GGG CGT TTG AAC GCG TAT TTT GGA GGC TTG GGT AAA AAC 
Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
495 500 505 

AAG CGG GTG GTG TTG TTT GAC ACT TTG ATC TCT AAA GTT GGG ACA GAA 
Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
510 515 520 525 

GGG CTT TTA GCC ATT TTA GGG CAT GAA TTA GGG CAT TTT AAA AAT AAG 
Gly Leu Leu Ala lie Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
530 535 540 

GAT TTG TTG AAA AGT TTA GGG ATT ATG GGA GGC TTA CTC GCT CTT GTT 
Asp Leu Leu Lys Ser Leu Gly lie Met Gly Gly Leu Leu Ala Leu Val 
545 550 555 




TT GCT CTG ATC GCT CAT TTG CCG CCG TTG GTT TTT GAA GGC TTC AAT 
he Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
560 565 570 



GTC TCA CAA ACG CCA GCG AGT TTG ATT GCG ATT TTA CTC TTG TTT TTG 
Val Ser Gin Thr Pro Ala Ser Leu lie Ala lie Leu Leu Leu Phe Leu 
575 580 585 

CCG GTA TTT TCT TTT TAC GCT ATG CCT TTG ATC GGG TTT TTT AGC CGA 
Pro Val Phe Ser Phe Tyr Ala Met Pro Leu He Gly Phe Phe Ser Arg 
590 595 600 605 

AAG AAT GAA TAC AAT GCA GAC AAG TTT GGG GCG AGT TTA AGC TCT AAA 
Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
610 615 620 



GAG GTT TTA GCC AAA GCG TTA GTG TCT ATT GTG AGT GAG AAT AAA GCG 
Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
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625 630 635 

TTC CCC TAT TCG CAC CCT TTT TAT GTT TTC TTG CAT TTC ACG CAC CCG 
Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
640 645 650 

CCC TTA TTA GAG CGC TTG AAA GCT TTG GAT TAT GAA ATT GAA TGA 
Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
655 660 665 




(2) ANGABEN ZU SEQ ID NO: 110: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 415 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 110: 

et Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp lie Asp Met lie 
15 10 15 

lie Cys lie Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr lie Val Gly 
20 25 30 

Asp lie Leu Gin Leu Lys Phe lie Arg Gin Lys Leu Cys Glu Lys Pro 
35 40 45 

Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala lie 
50 55 60 

Arg Lys Met Gin Leu Ser lie lie Ser Gin lie Leu Asp Gly lie lie 
65 70 75 80 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
85 90 95 

His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
100 105 110 



Leu Phe Leu Ala lie Gin Ser Val Leu Ala Leu Pro lie Ser Tyr Tyr 
115 120 125 



'hr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
130 135 140 

Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 

145 150 155 160 

Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met He He Glu His Val 
165 170 175 

Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He 
180 185 190 

Leu Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe 
195 200 205 

Thr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin He Glu Gly Met Met 
210 215 220 
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Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
225 230 235 240 

Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
245 250 255 

Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
260 265 270 

Gly Leu Leu Ala lie Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
275 280 285 

Asp Leu Leu Lys Ser Leu Gly lie Met Gly Gly Leu Leu Ala Leu Val 
290 295 300 

Phe Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
305 310 315 320 

Val Ser Gin Thr Pro Ala Ser Leu lie Ala lie Leu Leu Leu Phe Leu 
325 330 335 

ro Val Phe Ser Phe Tyr Ala Met Pro Leu lie Gly Phe Phe Ser Arg 
340 345 350 

Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
355 360 365 

Glu Val Leu Ala Lys Ala Leu Val Ser lie Val Ser Glu Asn Lys Ala 
370 375 380 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
385 390 395 400 

Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
405 410 415 

(2) ANGABEN ZU SEQ ID NO: 111: 

( i ) S E QUEN Z KENNZE I CHEN :. 

(A) LANGE : 1566 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS189 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1566 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 111: 

ATG AAA AAC ATT TAT CTT GAT GTG AAA GCC AGC ATT GAA AAT CTC CAA 
Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
420 425 430 

AAT ATT TTT AAA AAC ACT GAT AAT GAA AAT GAA AGA CTA AAA AAA TTC 
Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
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435 440 445 

AAC CAA GAA GCG TTG GAG GTG TTT CAA AAA TTA GAG CGT GAA AGT TTA 
Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
450 455 460 

AAA GAG CTT GAA AGC TTA AAA AAT AAT GAG GAG TGG GAA AAT TTT ACT 
Lys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
465 470 475 

ATC GCT TTT TAT GGG GAA ACC GGT GCG GGG AAA TCA ACC TTC ATT GAA 
lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
480 485 490 495 

TGT TTG AGA ATG TTT TTT AAA GAA CAA AGT AAA GTA GTT CAA CAA GAA 
Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
500 505 510 



CGA TTC AAG CGG CTT TAT TCC AAT TAC CAA AAC AAC TAT CAA AAT GAT 
Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
515 520 525 



LAA TGC AAA AAG CAA GCT ATT TTA AAC GAA CTT CAT TCA TTG CAA GAT 
lu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
530 535 540 

GGA GCG ATC ATA GGC GAT GGG AGG AGC GAT TTC ACT TTA AAA ACA CGA 
Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
545 550 555 

TCT TAT TCT TTC CAA TAC AAC CAT CAA AAC TTT ACT TTG CTT GAT GTT 
Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
560 565 570 575 

CCA GGG ATA GAA GGC GAC GAA AAA AAA GTG ATC GAT CAG ATT TCT AAC 
Pro Gly lie Glu Gly Asp Glu Lys Lys Val lie Asp Gin lie Ser Asn 
580 585 590 

GCA ACG CAA AAA GCC CAT GCT ATT TTT TAT GTT ACC AAA ACG CCT AAT 
Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
595 600 605 



CCT CCG CAA AAA GGA GAA GAG AAA AAA GAA GGG ACG ATT GAA AAA ATC 
Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr He Glu Lys He 
610 615 620 



CAA AAA CAA CTT GAT TCG CAA ACA GAG GTA TGG ACG ATT TTT AAC AAA 
Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
625 630 635 

CCG ATT AAC AAC CCA AGA GCT TTC AAA GAT GGG CTT ATT GAT GGA AGC 
Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
640 645 650 655 

GAA AAA GAA AGC TTA AAA ATT TTA AAT AAA GAA ATG AAA AAC ATT TTA 
Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
660 665 670 

GGC AAA CAC TAC AAG GGC TAT AAA GCA GTG AGC GCC CAA GTG GCT TTT 
Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
675 680 685 



TAT GGT CTT TCA TCG GCT TTG ATC CCA GGG ACT GAT TTT GAT AAA AAC 
Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
690 695 700 

AAA CAA AAA TTT TTA AAA GAT TTT AAA GCA AGA GAA TTA TTG TAT CAA 
Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
705 710 715 

TCC CAT TTC CAA CAA TTA GGA GAA TTT ATA GCC GAA GAG CTT ATT AAA 
Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
720 725 730 735 

AAC TCG CGT GCC AAA ATC ATT CAA TCA AAC TGC AAT AAA GCC TTA AAA 
Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
740 745 750 

GTG GTA GAA CAA TTG CAA AAG GCG ATC GAA ATT ACG ATT GAA AAA CGG 
Val Val Glu Gin Leu Gin Lys Ala lie Glu lie Thr lie Glu Lys Arg 
755 760 765 



TC GAT CCA ATG ATT AAA GAA GCA CAA GAA TAC CAA CAC GAA GCC CGC 
le Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
770 775 780 



Lys 



TAT AAT CTG GAT CGT TCT ACA GAT AAA TTT ATA TTA AAT TTA ACC AAT 
Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
785 790 795 

TCA GCG TTC TAC GAA ATC GAT CAA TTC AAA TCT GAC TTG AGA GAA AAA 
Ser Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
800 805 810 815 

ATG TAT GCG CAT ATT AAC AAA AAT ATT GAA GAT GAG GAA TGT AAA GAA 
Met Tyr Ala His He Asn Lys Asn He Glu Asp Glu Glu Cys Lys Glu 
820 825 830 

ATT TTT AAA AAT GAA CTC ATT CAA GGA ATT GAA ACA TTG CAT GAA GAC 
He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
835 840 845 

ATA AAA TGG CGG TTT AGA GAA TGT GAG AAA CGA TTT GAT GGA GAG ATA 
He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
850 855 860 



GAA GCT ATT AAA CAA CTT GAA TAC AGA ATT AAA GAT TCT CTA GCA 
Lys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
865 870 875 

ATG TTA GAG CGC ATC AGT ATT GAT AGA GAC TTT AAT CTT AAT TTT GAT 
Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
880 885 890 895 

ACT GAT AGC GGT ATT GAT GGA ACA AAA TTA GCC ACT TCA ATA GGA GGT 
Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
900 905 910 

TTG GGT TTG CTT GGG ATA TTT AAC GCT TGG AAT CCT ATG GGT TGG CTT 
Leu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
915 920 925 



GCT CTG ACC GCA GGA TTA TTG CAG GAT TAG 
Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
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930 935 

(2) ANGABEN ZU SEQ ID NO: 112: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 522 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 112: 

Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
15 10 15 

Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
20 25 30 

Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
35 40 45 

■ys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 

^50 55 60 

lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe He Glu 

65 70 75 80 

Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
85 90 95 

Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
100 105 110 

Glu Cys Lys Lys Gin Ala He Leu Asn Glu Leu His Ser Leu Gin Asp 
115 120 125 

Gly Ala He He Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
130 135 140 



Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
145 150 155 160 



Pro Gly He Glu Gly Asp Glu Lys Lys Val He Asp Gin He Ser Asn 
165 170 175 



Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
180 " 185 190 

Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr He Glu Lys He 
195 200 205 

Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
210 215 220 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
225 230 235 240 

Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
245 250 255 

Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
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260 265 270 

Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
275 280 285 

Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
290 295 300 

Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
305 310 315 320 

Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
325 330 335 

Val Val Glu Gin Leu Gin Lys Ala lie Glu He Thr He Glu Lys Arg 
340 345 350 

He Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
355 360 365 

Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
370 375 380 

er Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
385 390 395 400 

Met Tyr Ala His He Asn Lys Asn He Glu Asp Glu Glu Cys Lys Glu 
405 410 415 

He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
420 425 430 

He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
435 440 445 

Lys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
450 455 460 

Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
465 470 475 480 



Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
485 490 495 



eu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
500 505 510 



Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
515 520 

(2) ANGABEN ZU SEQ ID NO: 113: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1782 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS191 
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(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1.-1782 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 113: 

ATG AAA GCT ATA AAA ATA CTT TTT ATA ATG ACA CTC AGT TTA AAC GCT 
Met Lys Ala lie Lys lie Leu Phe He Met Thr Leu Ser Leu Asn Ala 
525 530 535 

ATC AGC GTG AAT AGG GCG TTG TTT GAT TTA AAA GAT TCG CAA TTA AAA 
He Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
540 545 550 

GGG GAA TTA ACG CCA AAA ATA GTG AAT TTT GGG GGT TAT AAA AGC AGC 
Gly Glu Leu Thr Pro Lys He Val Asn Phe Gly Gly Tyr Lys Ser Ser 
555 560 565 570 

ACT GAA GAG TGG GGG GCT ACG GCT TTA AAC TAT ATC AAT GCG GCT AAT 
Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr He Asn Ala Ala Asn 
575 580 585 

r GGC GAT GCG AAA AAA TTC AGC ACT CTA GTG GAA AAA ATG CGT TTT AAC 
Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
590 595 600 

TCC GGT ATA TTG GGG AAT TTA AGA GTG CAT GCA CGT TTG AGG CAA GCC 
Ser Gly He Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
605 610 615 

CTA AAA TTG CAA AAG AAT TTG AAA TAT TGC CTT AAA ATC ATC GCT AGG 
Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys He He Ala Arg 
620 625 630 

GAT TCT TTT TAT AGC TAC CGC ACC GGT ATT TAT ATC CCC TTA GGC ATT 
Asp Ser Phe Tyr Ser Tyr Arg Thr Gly He Tyr He Pro Leu Gly He 
635 640 645 650 

TCT TTA AAA GAT CAA AAA ACG GCT CAA AAA ATG CTC GCT GAT TTG AGC 
Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
655 660 665 



rTG GTA GGG GCG TAT CTT AAA AAA CAA CAA GAG AAT GAA AAG GCT CAA 
al Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
670 675 680 



AGC CCT TAT TAC AGA AAC AAC AAC TAT TAC AAC TCT TAC TAT AGC CCT 
Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
685 690 695 

TAT TAC GGA ATG TAT GGT ATG TAT GGC ATG GGC ATG TAT GGA ATG TAT 
Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
700 705 710 

GGC ATG GGC ATG TAT GAT TTT TAT GAC TTT TAT GAT GGC ATG TAT GGA 
Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
715 720 725 730 

TTC TAC CCT AAC ATG TTT TTC ATG ATG CAA GTT CAA GAT TAC TTG ATG 
Phe Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
735 740 745 
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TTA GAA AAT TAC ATG TAT GCG CTC GAT CAA GAA GAG ATT TTA GAT CAT 
Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu lie Leu Asp His 
750 755 760 

GAC GCT TCT ACT GAC CAA CTT GAT ACG CCT ACT GAT GAT GAC AAA GAC 
Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
765 770 775 

GAT AAA GAC GAT AAA TCC TTA CAG CAG GCA AAT CTT ATG AAC TTT TAT 
Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
780 785 790 

CGT GAT CCC AAA TTC AGC AAA GGC ATT CAA ACC AAC CGC TTG AAT AGC 
Arg Asp Pro Lys Phe Ser Lys Gly lie Gin Thr Asn Arg Leu Asn Ser 
795 800 805 810 

GCT TTA GTC AAT TTA GAC AAC AGT CGC ATG CTC AAA GAC AAT TCG CTT 
Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
815 820 825 

TTC CAC ACT AAA GCC ATG CCC ACT AAA AGC GTG GAT GCG ATA ACT TCT 
he His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala lie Thr Ser 
830 835 840 

CAA GCC AAA GAG CTT AAC CAT TTA GTG GGG CAA ATC AAA GAA ATG AAG 
Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin lie Lys Glu Met Lys 
845 850 855 

CAA GAC GGG GCG AGT CCT AGT AAG ATT GAT TCA GTT GTC AAT AAA GCT 
Gin Asp Gly Ala Ser Pro Ser Lys lie Asp Ser Val Val Asn Lys Ala 
860 865 870 

ATG GAA GTG AGG GAC AAG CTA GAC AAT AAT CTC AAC CAA CTA GAC AAT 
Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
875 880 885 890 

GAC TTA AAA GAT CAA AAA GGG CTT TCA AGC GAG CAA CAA GCT CAA GTG 
Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
895 900 905 

GAT AAA GCC CTA GAC AGC GTG CAA CAA TTA AGC CAT AGC AGC GAT GTG 
Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
910 915 920 



rTG GGG AAT TAT TTA GAC GGG AGT TTG AAA ATT GAT GGC GAT GAT AGA 
al Gly Asn Tyr Leu Asp Gly Ser Leu Lys lie Asp Gly Asp Asp Arg 
925 . 930 935 

GAT GAT TTG AAT GAT GCG ATG AAT AAC CCT ATG CAA CAA CCC GTG CAA 
Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
940 945 950 

CAA ACG CCT ACT AGC AAC ATG GCC GAC ACC CAT GCA AAT GAC AGC AAG 
Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
955 960 965 970 

GAT CAA GGG AGT AAC GCG CTC ATA AAC CCT AAC AGC GCC ACT AAC GCC 
Asp Gin Gly Ser Asn Ala Leu lie Asn Pro Asn Ser Ala Thr Asn Ala 
975 980 985 



GAC GAC ACT CAC ACT GAC GAT ACT CAC ACT GAC ACT AAC ACC ACA AAC 
Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
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990 995 1000 

GAT GCT AGC ACC ACT GAC ACC CCC ACT GAC GAT AAA GAT GCT AGC GGC 1488 
Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
1005 1010 1015 

TTG AAC AAT ACC GGC GAT ATG AAT AAC ACG GAT ACC GGC AAC ACG GAC 1536 
Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
1020 1025 1030 

ACC GGC AAT ACG GAT ACC GGT AAC ACT GAT GAT ATG AGC AAC ATG AAC 1584 
Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
1035 1040 1045 1050 

AAC GGC AAC GAT GAT ACG GGT AAC GCT AAT GAC GAC ATG AGC AAC GGC 1632 
Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
1055 1060 1065 

AAC GAC ATG GGC GAT GAT TTG AAC AAC GCG AAC GAT ATG AAC GAC GAC 1680 
Asn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
1070 1075 1080 

TG GGT AAT GGC AAC GAT GAC ATG GGC GAT ATG GGG GAT ATG AAC GAC 1728 
et Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
1085 1090 1095 



GAT ATG GGT GGC GAT 


ATG 


GGA GAC 


ATG 


GGG 


GAT 


Asp Met Gly Gly Asp 


Met 


Gly Asp 


Met 


Gly 


Asp 


1100 




1105 








AAT TGA 
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(2) ANGABEN ZU SEQ ID NO: 114: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 114: 

et Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
15 10 15 

lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
20 25 30 

Gly Glu Leu Thr Pro Lys lie Val Asn Phe Gly Gly Tyr Lys Ser Ser 
35 40 45 

Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr lie Asn Ala Ala Asn 
50 55 60 

Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
65 70 75 80 



Ser Gly lie Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
85 90 95 
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Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys lie lie Ala Arg 
100 105 110 

Asp Ser Phe Tyr Ser Tyr Arg Thr Gly lie Tyr lie Pro Leu Gly lie 
115 120 125 

Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
130 135 140 

Val Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
145 150 155 160 

Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
165 170 175 

Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
180 185 190 

Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
195 200 205 

he Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
210 215 220 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu lie Leu Asp His 
225 230 235 240 

Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
245 250 255 

Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
260 265 270 

Arg Asp Pro Lys Phe Ser Lys Gly lie Gin Thr Asn Arg Leu Asn Ser 
275 280 285 

Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
290 295 300 

Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala lie Thr Ser 
305 310 315 320 

Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin lie Lys Glu Met Lys 
325 330 335 

Gin Asp Gly Ala Ser Pro Ser Lys lie Asp Ser Val Val Asn Lys Ala 
340 345 350 

Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
355 360 365 

Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
370 375 380 

Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
385 390 395 400 

Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys lie Asp Gly Asp Asp Arg 
405 410 415 

Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
420 425 430 



i 
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Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
435 440 445 

Asp Gin Gly Ser Asn Ala Leu He Asn Pro Asn Ser Ala Thr Asn Ala 
450 455 460 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
465 470 475 480 

Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
485 490 495 

Leu Asn Asn. Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
500 505 510 

Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
515 520 525 



Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
530 535 540 



sn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
45 550 555 560 



Met Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
565 570 575 

Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
580 585 590 
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